第一节 

短语结构文法是关于词和词序列如何结合起来形成句子成分的。

和一般views中前端数据的获取一样。

     1 Python里面还有一种好的数据类型是String

依存文法是一个独特的和互补的方式,集中关注的是词与其他词之间的关系。依存关系是一个中心词与它的依赖之间的二元对称关系。一个句子的中心通常是动词,所有其他词要么依赖于中心词,要么依赖路径与它联通。

    def save_model(self, request, obj, form, change):

     2 一个String是通过” 或者 “”包成的串

依赖关系表示是一个加标签的有向图,其中节点是词汇项,加标签的弧表示依赖关系,从中心词到依赖。

        door_id_list= request.REQUEST.getlist(‘door’)

     3 设置变量brian值为”Always look on the bright side of life!”

图中显示了一个依存关系图,箭头从中心词指向它们的依赖。

        obj.save()

[python]  

>>> ->
-> -> -> -> -> ->

        print obj.id,’=========id’

#Set the variable brian on line 3!  

下面的例子,演示了如何捕捉歧义:

        for door_id in door_id_list:

brian = “Always look on the bright side of life!”  

>>>pdp=>>>sent = >>>trees =>>> tree  (pajamas my)))

            print Door.objects.get(id=int(door_id)).door_name

 

配价与词汇

door_id_list就是获取的值,以前想的太复杂  原来这么简单 

 第二节

我们来看这样一组句子:

def
save_model(self, request, obj, form, change): door_id_list=
request.REQUEST.getlist(door) obj.save() print obj.id,=========id
for…

    1 练习

(12

       1 把变量caesar变量设置为Graham

这些句子对应着下面这个表格,展示了VP产生式和他们的中心词汇

       2 把变量praline变量设置为john

-> |

       3 把变量viking变量设置为Teresa

扩大规模

[python]  

如果把这种做法可以扩大到覆盖自然语言的大型语料库,手工构建这样一套产生式是非常困难的。

#澳门微尼斯人手机版,Assign your variables below, each on its own line!  

8.6文法开发

caesar = “Graham”  

在这一节中尝试扩大这种方法的规模来处理现实的语言语料库。这这里访问树库,并看看开发广泛覆盖的文法的挑战。

praline = “John”  

树库和文法

viking = “Teresa”  

corpus模块定义了树库语料的阅读器。

#Put your variables above this line  

>>>>>>t =treebank.parsed_sents(>>>-61--TMP (NNP Nov.)(CD 29

print caesar  

在下面的程序中,使用了一个简单的过滤器找出带句子补语的动词。

print praline  

假设我们已经有了一个形如VP->SV
S的产生式,这个信息使我们能够识别出那些包括在SV中的扩张中的特别的动词。

print viking  

= [child.node  child  (tree.node ==)  ( >>>>>>[subtree  tree  subtree , [Tree(, []), Tree(,[Tree(, ...]), ...]), ...]

 

nltk.corpus.ppattach是一个关于特别动词配价的信息源。在这里找出具有固定介词和名词的介词短语对,其中介词短语附着到VP还是NP,由选择的动词决定。

 第三节

>>>entries = nltk.corpus.ppattach.attachments(>>>table = nltk.defaultdict(>>> entry = entry.noun1 +  +entry.prep +  +>>> len(table[key]) > 1 key,, sorted(table[key][]), , sorted(table[key][])

    1 Python是通过\来实现转义字符的

有害的歧义

    2 练习把’Help! Help! I’m being repressed!’ 中的I’m中的’进行转义

文法分析是容易产生歧义的.在这里不做过多的解释,有的时候在分析句子的时候可怕的低效.

[python]  

为了解决这个问题,概率分析会帮我们解决,它使我们能够以来自语料库的证据为基础对歧义句的解析进行排名.

#The string below is broken. Fix it using the escape backslash!  

加权文法

‘Help! Help! \’\m being repressed!’  

概率上下文无关文法(probabilistic context-free
grammar,PCFG)是一种上下文无关文法,他的每一个产生式关联一个概率。PCFG产生的一个解析的概率,仅仅是他用到的产生式的概率的乘积。

 

如下面这个文法:

 第四节

grammar= nltk.parse_pcfg()

    1 我们可以使用””来避免转义字符的出现

为了确保由文法生成的树能形成概率分布,PCFG文法强加了约束:产生式所有给定的左侧的概率之和必须为1。

    2 练习: 把变量fifth_letter设置为MONTY的第五个字符

 

[python]  

>>>viterbi_parser=>>> viterbi_parser.parse([,, =0.064)

“”” 

是关于词和词序列如何结合起来形成句子成分的。 依存文法
是一个独特的和互补的方式,集中关注的是词与其他词之间的关…

The string “PYTHON” has six characters, 

numbered 0 to 5, as shown below: 

 

+—+—+—+—+—+—+ 

| P | Y | T | H | O | N | 

+—+—+—+—+—+—+ 

  0   1   2   3   4   5 

 

So if you wanted “Y”, you could just type 

“PYTHON”[1] (always start counting from 0!) 

“””  

fifth_letter = “MONTY”[4]  

  

print fifth_letter  

 

 第五节

    1 介绍String的第一种方法,len()求字符串的长度

发表评论

电子邮件地址不会被公开。 必填项已用*标注