麻豆精品无码av,欧美1区2区,久久中文字幕乱码人妻,亚洲欧美另类少妇精品,在线看黄射,69pao高清,九九九久久久国产精品,子操大逼1234区,九九爱99热精品

2
點(diǎn)贊
0
評(píng)論
0
轉(zhuǎn)載
收藏

Lesson 17----NLTK 句法分析

一、Chunking 句子分塊


Segmentation and Labeling at both the Token and Chunk Levels


noun phrase chunkingNP-chunking)名詞短語


import nltk


sentence = [("the", "DT"), ("little", "JJ"), ("yellow", "JJ"),("dog", "NN"), ("barked", "VBD"), ("at", "IN"),  ("the", "DT"), ("cat", "NN")]

grammar = "NP: {<DT>?<JJ>*<NN>}"


cp = nltk.RegexpParser(grammar)

result = cp.parse(sentence)

print(result)


result.draw()


----------------------------------------------------------

如果覺得上述對(duì)句子人式標(biāo)注很麻煩,可以改為以下:

import nltk

sentence="the little dog baked at the cat"

words=nltk.word_tokenize(sentence)   #分詞

sent_tag=nltk.pos_tag(words)       #加標(biāo)注

grammar = "NP: {<DT>?<JJ>*<NN>}"

cp = nltk.RegexpParser(grammar)

result = cp.parse(sent_tag)

print(result)

result.draw()



練習(xí)1:考慮下面的名詞短語如何表示。

another/DT sharp/JJ dive/NN trade/NN figures/NNS any/DT new/JJ policy/NN measures/NNS earlier/JJR stages/NNS Panamanian/JJ dictator/NN Manuel/NNP Noriega/NNP二、句子結(jié)構(gòu)分析 1  句子嵌套   Usain Bolt broke the 100m recordb. The Jamaica Observer reported that Usain Bolt broke the 100m recordc. Andre said The Jamaica Observer reported that Usain Bolt broke the 100m recordd. I think Andre said the Jamaica Observer reported that Usain Bolt broke the 100m record    2 句子歧義 I shot an elephant in my pajamas.http://www.nltk.org/book/ch08.html groucho_grammar = nltk.CFG.fromstring(""" S -> NP VP PP -> P NP NP -> Det N | Det N PP | 'I' VP -> V NP | VP PP Det -> 'an' | 'my' N -> 'elephant' | 'pajamas' V -> 'shot' P -> 'in' """) sent = ['I', 'shot', 'an', 'elephant', 'in', 'my', 'pajamas'] parser = nltk.ChartParser(groucho_grammar) for tree in parser.parse(sent):     print(tree) 3   Context Free Grammar 上下文無關(guān)文法 (1)遞歸下降解析器 nltk.app.rdparser() (2)移進(jìn)-歸約解析器 nltk.app.srparser()
聲明:本內(nèi)容系學(xué)者網(wǎng)用戶個(gè)人學(xué)術(shù)動(dòng)態(tài)分享,不代表平臺(tái)立場(chǎng)。

廣東外語外貿(mào)大學(xué) 信息科學(xué)與技術(shù)學(xué)院
SCHOLAT.com 學(xué)者網(wǎng)
免責(zé)聲明 | 關(guān)于我們 | 聯(lián)系我們
聯(lián)系我們:
返回頂部
巩义市| 英吉沙县| 沙湾县| 麟游县| 湛江市| 石首市| 象山县| 沙河市| 拉萨市| 孝感市| 奉贤区| 乌什县| 栾川县| 伊金霍洛旗| 大理市| 文成县| 攀枝花市| 蒲江县| 河北区| 双桥区| 休宁县| 平昌县| 四子王旗| 蕉岭县| 新疆| 探索| 东乡县| 福贡县| 阿克陶县| 二连浩特市| 克拉玛依市| 江都市| 渝中区| 包头市| 樟树市| 崇阳县| 班玛县| 阿图什市| 汉沽区| 绥棱县| 泗水县|