温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

使用python怎么倒排索引

发布时间:2021-04-20 17:48:32 来源:亿速云 阅读:467 作者:Leah 栏目:开发技术

这期内容当中小编将会给大家带来有关使用python怎么倒排索引,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。

python可以做什么

Python是一种编程语言,内置了许多有效的工具,Python几乎无所不能,该语言通俗易懂、容易入门、功能强大,在许多领域中都有广泛的应用,例如最热门的大数据分析,人工智能,Web开发等。

代码如下:

#encoding:utf-8 fin = open('1.txt', 'r') ''' 建立正向索引:  “文档1”的ID > 单词1:出现位置列表;单词2:出现位置列表;…………  “文档2”的ID > 此文档出现的关键词列表。 ''' forward_index = {} for line in fin:  line = line.strip().split()  forward_index[int(line[0])] = {}  words = line[1].split(',')  for i, index in enumerate(words):   if int(index) not in forward_index[int(line[0])].keys():    forward_index[int(line[0])][int(index)] = [i]   else:    forward_index[int(line[0])][int(index)].append(i) print 'forward_index:', forward_index ''' 建立倒排索引:  “关键词1”:“文档1”的ID,“文档2”的ID,…………  “关键词2”:带有此关键词的文档ID列表。 ''' inverted_index = {} for doc_id, words in forward_index.items():  for word_id in words.keys():   if word_id not in inverted_index.keys():    inverted_index[word_id] = [doc_id]   elif doc_id not in inverted_index[word_id]:    inverted_index[word_id].append(doc_id) print 'inverted_index:', inverted_index

输入(文档id:单词id):

1 3,4  2 3,4,2,4  3 2

输出:

forward_index: {1: {3: [0], 4: [1]}, 2: {2: [2], 3: [0], 4: [1, 3]}, 3: {2: [0]}}  inverted_index: {2: [2, 3], 3: [1, 2], 4: [1, 2]}

上述就是小编为大家分享的使用python怎么倒排索引了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注亿速云行业资讯频道。

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI