restructure + syntactic sugar implementation

2021-08-11 21:11:35 +02:00
parent 7365c41e11
commit 3a6814a850
27 changed files with 145 additions and 86 deletions
--- a/tests/test_simplelexer.py
+++ b/tests/test_simplelexer.py
@ -0,0 +1,100 @@
+from simplelexer import lex
+
+# Every insturction ends with an newline
+def test_single_quoted_string():
+    for s in ["""'abc'""",
+              """'ab"c'""",
+              """'ab\\'c'""",
+              ]:
+        tokens = lex(s)
+        token, newline, eof = tokens
+        assert token.name == 'String'
+        assert newline.name == 'Newline'
+        assert eof.name == 'EOF'
+
+def test_number():
+     for s in ["0",
+               "+1",
+               "-1",
+               "-1123123",
+               ]:
+         tokens = lex(s)
+         token, newline, eof = tokens
+         assert tokens[0].name == 'Number'
+         assert token.name == 'Number'
+         assert newline.name == 'Newline'
+         assert eof.name == 'EOF'
+
+def test_name():
+    for s in ["abc",
+              "_",
+              "a_0",
+              "_0",
+              ]:
+        tokens = lex(s)
+        token, newline, eof = tokens
+        assert tokens[0].name == 'Name'
+        assert token.name == 'Name'
+        assert newline.name == 'Newline'
+        assert eof.name == 'EOF'
+
+def test_primitvename():
+    for s in ["$abc",
+              "$_",
+              "$a_0",
+              "$_0",
+              ]:
+        tokens = lex(s)
+        token, newline, eof = tokens
+        assert tokens[0].name == 'PrimitiveName'
+        assert token.name == 'PrimitiveName'
+        assert newline.name == 'Newline'
+        assert eof.name == 'EOF'
+
+def test_long():
+    for s, numtoken in [
+             ("if x:\n    print x", 10),
+             ("if x:#foo\n    x abc = 7", 12),
+             ("1 a \\\n 2", 5)
+            ]:
+        tokens = lex(s)
+        assert len(tokens) == numtoken
+
+def test_indentation():
+    s = """a
+b
+    c
+        d
+      
+  #some comment
+    e
+        f
+    """
+    tokens = lex(s)
+    assert [t.name for t in tokens] == ["Name", "Newline", "Name", "Newline",
+                                        "Indent", "Name", "Newline", "Indent",
+                                        "Name", "Newline", "Dedent", "Name",
+                                        "Newline", "Indent", "Name", "Newline",
+                                        "Dedent", "Dedent", "EOF"]
+
+# This is only one line! The \ is used for line continuation
+def test_linecont():
+    s = "a a \\\n     b"
+    tokens = lex(s)
+    assert [t.name for t in tokens] == ["Name", "Name", "Name", "Newline",
+                                        "EOF"]
+
+# newline token between brackets are ignored ...
+def test_parenthesis():
+    s = "(a = \n     b)"
+    tokens = lex(s)
+    assert [t.name for t in tokens] == ["OpenBracket", "Name", "Assign", "Name",
+                                        "CloseBracket", "Newline", "EOF"]
+
+# ... unless you insert a comment
+def test_comment():
+    s = "(a = # foo this is a comment \n     b)"
+    tokens = lex(s)
+    assert [t.name for t in tokens] == ["OpenBracket", "Name", "Assign", "Name",
+                                        "CloseBracket", "Newline", "EOF"]
+