正在开发一门简单的脚本语言- Community

正在开发一门简单的脚本语言

Experiences and Insight 1312 views · 11 replies ·

ldmpscript

deepin

2012-12-06 17:52

Author

这个脚本很简单，不需要模拟CPU。
最终状态的是可以通过远程传输脚本TEST.LDMP. [主要是为了解决WEBKIT与GTK互通的麻烦.现在又需要一个轻量的,可定制的东西]
然后我写的客户端,
词法分析,语法分析脚本,语义分析,
最后进行渲染,
现在的元素比较少,
只有entry, button, line, vbox, hbox.
本地也可以编写脚本,然后F5可以刷新脚本渲染界面.
语法分析,语义分析, 远程的正在编写中.

大家感觉这种脚本对于小型的渲染是不是很方便. 远程只要更新一下, 客户端刷新一下就显示出来.
比如: 只想简单的显示一些东西.

比如:
像这样的东西,你就想简单的搜索一下,然后显示出你想要的列表东西.
选区_009.png
选区_010.png
选区_011.png
最终的效果是这样.简单的编写脚本,就可以进行渲染,远程修改一下,就可以显示出来,是轻量的.快速的.
QQ截图20121206100736.png

会自动生成一棵控件树. 用来表示包含关系或父子关系.

'版本号
' '事件集合
' 这是以后的设想!!现在未了满足需求,只能将事件暂时固定起来.
' import event
' btn1.connect("clicked", event.btn1_clicked)

Copy the Code

我定义的东西.

'''
----------------------
运算符 | ID | 单词
10 =
----------------------
界符号 | ID | 单词
05 <
06 >
07 /
----------------------
关键字 | ID | 单词
30 version
31 ldmp
32 name
33 value
34 event
35 callback
36 vbox
37 hbox
38 entry
----------------------
'''
用于词法分析.

Copy the Code

语法就几条.
<....>

基于表格驱动的词法分析算法。
用PYTHON。

# /* 用于搜索关键字. */
keyword_dict = {'a':[],
'b':["button"],
'c':["callback"],
'd':[],
'e':["event"],
'f':[],
'g':[],
'h':["hbox"],
'i':[],
'j':[],
'k':[],
'l':["ldmp"],
'm':[],
'n':["name"],
'o':[],
'p':[],
'q':[],
'r':[],
's':[],
't':[],
'u':[],
'v':["vbox", "value", "version"],
'w':[],
'x':[],
'y':[],
'z':[]
}
'''
标识符 ID 03
字符串常量 ID 02
----------------------
运算符 | ID | 单词
10 =
----------------------
界符号 | ID | 单词
05 <
06 >
07 /
----------------------
关键字 | ID | 单词
30 version
31 ldmp
32 name
33 value
34 event
35 callback
36 vbox
37 hbox
38 entry
39 button
----------------------
'''
'''(回车,空格)----------
|--------
|--------
|--------
|--------
标识符(字母)|---字母,数字循环---(05)---其它---((-03)) # 最后会查询关键字表，看是否为关键字.
<|--------(06)---全部---((-05))
>|--------(07)---全部---((-06))
/|--------(08)---全部---((-07))
"|--------(09)--- " ---((-02))
|--回车---((-100))
'|--------(10)---回车---((-40))
'''
lex_table = []
def init_lex_table():
# init lex_table.
for i in range(0, 11):
lex_table.append([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0])
# create lex table.
for i in range(0, 129): # 0-127, 128(其它:比如[中文])
lex_table[0][i] = -100 # 出错状态.
lex_table[0][ord("<")] = -5
lex_table[0][ord(">")] = -6
lex_table[0][ord('/')] = -7
lex_table[0][ord('=')] = -10
lex_table[0][ord("'")] = 10
lex_table[0][ord('"')] = 9
if (ord('a') <= i <= ord('z')) or (ord('A') <= i <= ord('Z')):
lex_table[0][i] = 5
# 标识符.
if (ord('a') <= i <= ord('z')) or (ord('A') <= i <= ord('Z')) or (ord('0') <= i <= ord('9')):
lex_table[5][i] = 5
else:
lex_table[5][i] = -3
# 界符号.
lex_table[6][i] = -5
lex_table[7][i] = -6
lex_table[8][i] = -7
# 字符串.
lex_table[9][i] = 9 # 其它,中文,除了回车..->>跳转
lex_table[9][ord('"')] = -2 # 字符串.
lex_table[9][ord('\n')] = -100 # 字符串没有"结尾--->出错状态.
# 注释.
lex_table[10][i] = 10 # 注释跳转.
lex_table[10][ord('\n')] = -40 # 注释.
if __name__ == "__main__":
init_lex_table()
# import random
text = 'abcd123="我来看看看吧fjsdklfsdjkf"abc\n'.decode("utf-8")
row = 0
text_index = 0
index = ord(text[0])
token = ""
while text_index < len(text):
if text[text_index] != " " and text[text_index] != "\n":
if ord(text[text_index]) < 128:
index = ord(text[text_index])
else:
index = 128
# print "index:", index
row = lex_table[row][index]
# print "row:", row
token += text[text_index]
if row < 0:
if row == -40:
print "[注释]", token, "(id:", -row
elif row == -2:
print "[字符串]", token, "(id:", -row
elif row == -100:
print "[错误]-->>", token, "行号:", 0
elif row == -5:
print "[界符号]", token, "(id:", -row
elif row == -6:
print "[界符号]", token, "(id:", -row
elif row == -7:
print "[界符号]", token, "(id:", -row
elif row == -3: # 超前搜索一个，所以必须回退一位.
print "[标识符]", token[:-1], "(id:", -row # 进行查询关键字就知道了，不是关键字就是标识符了.
text_index -=1
elif row == -10:
print "[运算符]", token, "(id:", -row
row = 0
token = ""
text_index += 1

Copy the Code

因为以前做过一个智能小车模拟软件.
一个用于显示小车运作的动画.
一个用于编写智能小车代码的环境.
然后运行,小车运作动画的前端解释脚本,然后自己运行起来,有红灯,绿灯,转弯,遇到障碍自己转.
没办法,看见软件班的同学玩的很过瘾,只能听他们说,心里不爽啊` 所以自己就开发一个模拟软件,来模拟小车运动,来感受一下编写代码让小车运动起来的快感.
编写代码,编译过后生成脚本,然后动画前端读取脚本的指令,足条解释,如果没有遇到跳转指令的话,没事.

Reply Like 0 Favorite View the author

All Replies

左心房的痛

deepin

2012-12-06 18:32

脚本语言？？网页的？？那浏览器得支持才行啊，你要修改webkit?

Reply Like 0 View the author

ldmpscript

deepin

2012-12-06 19:03

脚本语言？？网页的？？那浏览器得支持才行啊，你要修改webkit?

没有，WEBKIT 那么庞大，我没有能力去修改。

ops:

我现在只是写一个简单的脚本而已。

没什么技术含量。主要为了解决WEBKIT和GTK 交互问题。
比如在WEBKIT在单击或者双击了，又或者移动了鼠标了，GTK该如何知道，这个一个非常麻烦的时候。
反正我现在需要的东西也不多，所以就这样吧，满足需求，简单的写一个，。

Reply Like 0 View the author

cxbii

deepin

2012-12-06 19:36

妈呀……牛人辈出

Reply Like 0 View the author

ldmpscript

deepin

2012-12-06 22:59

妈呀……牛人辈出

这个是简单的东西，没有你想的那么牛B，

Reply Like 0 View the author

cxbii

deepin

2012-12-06 23:12

[quote]妈呀……牛人辈出

这个是简单的东西，没有你想的那么牛B，[/quote]没事，总比我厉害啦

Reply Like 0 View the author

pdlenovo

deepin

2012-12-06 23:33

妈呀……牛人辈出

是啊真的很牛

Reply Like 0 View the author

ldmpscript

deepin

2012-12-06 23:40

[quote]妈呀……牛人辈出

是啊真的很牛[/quote]

没有你写操作系统牛，
我就一个水B，
这个东西很简单的，哎，你们都唔会了。连你这样写操作系统牛人都这样说，让我无地自容了。

Reply Like 0 View the author

vala2012

deepin

2012-12-07 00:29

保存的单词流信息:
id: 5 token: < type: TOKEN_TYPE_SCOPE_SYMBOL row: 0
id: 1 token: version row: 0
id: 10 token: = type: TOKEN_TYPE_OPERATOR row: 0
id: 2 token: 0.1 type: TOKEN_TYPE_STRING row: 0
id: 6 token: > type: TOKEN_TYPE_SCOPE_SYMBOL row: 0
id: 5 token: < type: TOKEN_TYPE_SCOPE_SYMBOL row: 0
id: 7 token: / type: TOKEN_TYPE_SCOPE_SYMBOL row: 0
id: 1 token: version row: 0
id: 6 token: > type: TOKEN_TYPE_SCOPE_SYMBOL row: 0
id: 5 token: < type: TOKEN_TYPE_SCOPE_SYMBOL row: 2
id: 1 token: ldmp row: 2
id: 6 token: > type: TOKEN_TYPE_SCOPE_SYMBOL row: 2
id: 5 token: < type: TOKEN_TYPE_SCOPE_SYMBOL row: 3
id: 1 token: vbox row: 3
id: 6 token: > type: TOKEN_TYPE_SCOPE_SYMBOL row: 3
id: 5 token: < type: TOKEN_TYPE_SCOPE_SYMBOL row: 4
id: 1 token: vbox row: 4
id: 6 token: > type: TOKEN_TYPE_SCOPE_SYMBOL row: 4
id: 5 token: < type: TOKEN_TYPE_SCOPE_SYMBOL row: 5
id: 1 token: button row: 5
id: 1 token: name row: 5
id: 10 token: = type: TOKEN_TYPE_OPERATOR row: 5
id: 2 token: btn1 type: TOKEN_TYPE_STRING row: 5
id: 1 token: value row: 5
id: 10 token: = type: TOKEN_TYPE_OPERATOR row: 5
id: 2 token: 确定 type: TOKEN_TYPE_STRING row: 5
id: 1 token: event row: 5
id: 10 token: = type: TOKEN_TYPE_OPERATOR row: 5
id: 2 token: clicked type: TOKEN_TYPE_STRING row: 5
id: 1 token: callback row: 5
id: 10 token: = type: TOKEN_TYPE_OPERATOR row: 5
id: 2 token: btn1_clicked type: TOKEN_TYPE_STRING row: 5
id: 6 token: > type: TOKEN_TYPE_SCOPE_SYMBOL row: 5
id: 5 token: < type: TOKEN_TYPE_SCOPE_SYMBOL row: 5
id: 7 token: / type: TOKEN_TYPE_SCOPE_SYMBOL row: 5
id: 1 token: button row: 5
id: 6 token: > type: TOKEN_TYPE_SCOPE_SYMBOL row: 5
id: 5 token: < type: TOKEN_TYPE_SCOPE_SYMBOL row: 6
id: 1 token: name row: 6
id: 10 token: = type: TOKEN_TYPE_OPERATOR row: 6
id: 2 token: text1 type: TOKEN_TYPE_STRING row: 6
id: 6 token: > type: TOKEN_TYPE_SCOPE_SYMBOL row: 6
id: 5 token: < type: TOKEN_TYPE_SCOPE_SYMBOL row: 6
id: 7 token: / type: TOKEN_TYPE_SCOPE_SYMBOL row: 6
id: 6 token: > type: TOKEN_TYPE_SCOPE_SYMBOL row: 6
id: 5 token: < type: TOKEN_TYPE_SCOPE_SYMBOL row: 7
id: 7 token: / type: TOKEN_TYPE_SCOPE_SYMBOL row: 7
id: 1 token: vbox row: 7
id: 6 token: > type: TOKEN_TYPE_SCOPE_SYMBOL row: 7
id: 5 token: < type: TOKEN_TYPE_SCOPE_SYMBOL row: 8
id: 7 token: / type: TOKEN_TYPE_SCOPE_SYMBOL row: 8
id: 1 token: vbox row: 8
id: 6 token: > type: TOKEN_TYPE_SCOPE_SYMBOL row: 8
id: 5 token: < type: TOKEN_TYPE_SCOPE_SYMBOL row: 9
id: 7 token: / type: TOKEN_TYPE_SCOPE_SYMBOL row: 9
id: 1 token: ldmp row: 9
id: 6 token: > type: TOKEN_TYPE_SCOPE_SYMBOL row: 9

Reply Like 0 View the author

pdlenovo

deepin

2012-12-07 00:49

[quote][quote]妈呀……牛人辈出

是啊真的很牛[/quote]

没有你写操作系统牛，
我就一个水B，
这个东西很简单的，哎，你们都唔会了。连你这样写操作系统牛人都这样说，让我无地自容了。[/quote]
其实我们只是专注的方向不同而已，要我来干这个，我肯定干不了，我曾经想为我的操作系统写个C编译器，
后来我却胆怯了，呵呵

Reply Like 0 View the author

ldmpscript

deepin

2012-12-07 02:00

#10

[quote]是啊真的很牛

没有你写操作系统牛，
我就一个水B，
这个东西很简单的，哎，你们都唔会了。连你这样写操作系统牛人都这样说，让我无地自容了。[/quote]
其实我们只是专注的方向不同而已，要我来干这个，我肯定干不了，我曾经想为我的操作系统写个C编译器，
后来我却胆怯了，呵呵[/quote]
我的能力也不足与开发一个编译器，做人是有量度的，知道自己有几斤几两。

Reply Like 0 View the author

ldmpscript

deepin

2012-12-08 00:00

#11

其实我们只是专注的方向不同而已，要我来干这个，我肯定干不了，我曾经想为我的操作系统写个C编译器，
后来我却胆怯了，呵呵

好吧，牛人，
给你看个例子，就知道词法分析多么简答了，不需要什么高深的确定性/非确定自动机理论。
我已经很详细的描述了。

#! /usr/bin/env python
# -*- coding: utf-8 -*-
# /* 用于搜索关键字. */
keyword_dict = {'a':[],
'b':["button"],
'c':["callback"],
'd':[],
'e':["event"],
'f':[],
'g':[],
'h':["hbox"],
'i':[],
'j':[],
'k':[],
'l':["ldmp"],
'm':[],
'n':["name"],
'o':[],
'p':[],
'q':[],
'r':[],
's':[],
't':[],
'u':[],
'v':["vbox", "value", "version"],
'w':[],
'x':[],
'y':[],
'z':[]
}
'''
标识符 ID 03
字符串常量 ID 02
----------------------
运算符 | ID | 单词
10 =
----------------------
界符号 | ID | 单词
05 <
06 >
07 /
----------------------
关键字 | ID | 单词
30 version
31 ldmp
32 name
33 value
34 event
35 callback
36 vbox
37 hbox
38 entry
39 button
----------------------
'''
'''(回车,空格)----------
|--------
|--------
|--------
|--------
标识符(字母)|---字母,数字循环---(05)---其它---((-03)) # 最后会查询关键字表，看是否为关键字.
<|--------(06)---全部---((-05))
>|--------(07)---全部---((-06))
/|--------(08)---全部---((-07))
"|--------(09)--- " ---(11) -- 全部 --((-02))
|--回车---((-100))
'|--------(10)---回车---((-40))
'''
lex_table = []
def init_lex_table():
# init lex_table.
for i in range(0, 12):
lex_table.append([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0])
# create lex table.
for i in range(0, 129): # 0-127, 128(其它:比如[中文])
lex_table[0][i] = 0 # 出错状态.
lex_table[0][ord("<")] = 6
lex_table[0][ord(">")] = 7
lex_table[0][ord('/')] = 8
lex_table[0][ord('=')] = 4
lex_table[0][ord("'")] = 10
lex_table[0][ord('"')] = 9
if (ord('a') <= i <= ord('z')) or (ord('A') <= i <= ord('Z')):
lex_table[0][i] = 5
# 标识符.
if (ord('a') <= i <= ord('z')) or (ord('A') <= i <= ord('Z')) or (ord('0') <= i <= ord('9')):
lex_table[5][i] = 5
else:
lex_table[5][i] = -3
# 运算符.
lex_table[4][i] = -10
# 界符号.
lex_table[6][i] = -5
lex_table[7][i] = -6
lex_table[8][i] = -7
# 字符串.
lex_table[9][i] = 9 # 其它,中文,除了回车..->>跳转
lex_table[11][i] = -2
lex_table[9][ord('"')] = 11 # 字符串.
lex_table[9][ord('\n')] = -100 # 字符串没有"结尾--->出错状态.
# 注释.
lex_table[10][i] = 10 # 注释跳转.
lex_table[10][ord('\n')] = -40 # 注释.
if __name__ == "__main__":
init_lex_table()
# import random
text = '"我来看看看吧fjsdklfsdjkf"\n'.decode("utf-8")
row = 0
text_index = 0
token = ""
while text_index < len(text):
if ord(text[text_index]) < 128:
index = ord(text[text_index]) # <
else:
index = 128
row = lex_table[row][index]
token += text[text_index]
if row < 0:
text_index -= 1# 超前搜索一个，所以必须回退一位.
if row == -40:
print "[注释]", token[:-1], "(id:", -row
elif row == -2:
print "[字符串]", token[:-1], "(id:", -row
elif row == -100:
print "[错误]-->>", token[:-1], "行号:", 0
break
elif row == -5:
print "[界符号]", token[:-1], "(id:", -row
elif row == -6:
print "[界符号]", token[:-1], "(id:", -row
elif row == -7:
print "[界符号]", token[:-1], "(id:", -row
elif row == -3:
print "[标识符]", token[:-1], "(id:", -row
elif row == -10:
print "[运算符]", token[:-1], "(id:", -row
row = 0
token = ""
text_index += 1

Copy the Code

将这些单词流保存到TOKENINFO中去.
/*
class TokenInfo(object):
def __init__(self):
      self.id = None
      self.type = None # token type.
      self.row  = None # token row.

class Stack(object):
'''
LL(1) 语法分析.
'''
def __init__(self):
      self.save_values = []

def pop(self):
      value = self.save_values.pop()
      return value

def push(self, value):
      self.save_values.append(value)

*/
他们已经不再是单词了,是TOKEN,是终结符,他们已经是不可再分割的拉.
等我写玩语法分析，我再给你看。
手动构造FIRST FLLOW集也非常简单，只要在纸上画画。没有什么语法错误就OK了，不需要程序写出来。
LL（1），这种是基于栈的，也比较号理解。
LL(1) 就是通过终结符和非终结符来确定另一个产生式的.
      self.parsing_table = [] # 语法分析表.
      self.product_list = [] # 产生式表.

Reply Like 0 View the author

New Thread

Rankings

7 days
30 days
90 days

Popular Events