spaCy中词频统计的方法是什么

676
2024/5/6 19:12:56
栏目: 编程语言
开发者测试专用服务器限时活动,0元免费领,库存有限,领完即止! 点击查看>>

在spaCy中,可以使用Count类来实现词频统计。具体步骤如下:

  1. 导入spacy库并加载模型
import spacy
nlp = spacy.load("en_core_web_sm")
  1. 创建一个空的字典用于存储词频统计结果
word_freq = {}
  1. 对文本进行分词,并统计每个词出现的次数
text = "This is a sample text for word frequency analysis."
doc = nlp(text)

for token in doc:
    word = token.text
    if word not in word_freq:
        word_freq[word] = 1
    else:
        word_freq[word] += 1
  1. 打印词频统计结果
for word, freq in word_freq.items():
    print(word, freq)

通过以上步骤,就可以实现spaCy中的词频统计功能。

辰迅云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>

推荐阅读: 怎么使用spaCy进行交叉验证