怎么使用NLTK库对齐文本

1493
2024/5/16 19:02:56
栏目: 编程语言
开发者测试专用服务器限时活动,0元免费领,库存有限,领完即止! 点击查看>>

NLTK库可以通过使用align_words函数对文本进行对齐。以下是一个示例代码:

from nltk.translate import AlignedSent
from nltk.translate import Alignment

src_words = ['I', 'saw', 'the', 'man']
tgt_words = ['Je', 'ai', 'vu', 'l', 'homme']

alignment = Alignment([(0, 0), (1, 1), (2, 2), (3, 3)])

aligned_sent = AlignedSent(src_words, tgt_words, alignment)

print(aligned_sent.words)
print(aligned_sent.mots)
print(aligned_sent.alignment)

在这个示例中,我们创建了一个包含源语言单词列表和目标语言单词列表的AlignedSent对象,然后打印出对齐后的结果。您也可以使用Alignment()函数来指定单词之间的对应关系,以生成自定义的对齐结果。

辰迅云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>

推荐阅读: 怎么导入NLTK库中的模块