《jmcomicron.mic天堂官网传送门:漫画世界的新视界-漫漫...》剧情简介:这引发了很多人的讨论jmcomicron.mic天堂官网传送门:漫画世界的新视界-漫漫...组合数据类型2019-08-07 09:14·数据七色本节内容框架集合类型及操作集合类型定义- 集合是多个元素的无序组合- 集合类型与数学中的集合概念一致- 集合元素之间无序每个元素唯一不存在相同元素- 集合元素不可更改不能是可变数据类型- 集合用大括号{}表示元素间用逗号分隔- 建立集合类型用{}或set()- 建立空集合类型必须用set()集合操作符集合处理方法集合类型应用场景- 包含关系比较- 数据去重序列类型及操作序列类型定义- 序列是具有先后关系的一组元素- 序列是一维元素向量元素类型可以不同- 序列类型包括字符串类型、元组类型、列表类型- 元素间由序号引导通过下标访问序列的特定元素序列处理函数及方法元组类型及操作- 元组是序列类型的一种扩展- 元组创建后不能被修改- 使用小括号()或tuple()创建元素间用逗号分隔- 可以使用或不适用小括号- 元组继承了序列类型的全部通用操作列表类型及操作- 列表创建后可以随意修改- 使用方括号[]或list()创建元素间用逗号分隔- 列表中各元素类型可以不同无长度限制序列类型应用场景- 用于数据表示:元组、列表- 表示一组有序数据进而操作他们- 元素遍历- 数据保护如果不希望数据被程序所改变转换成元组类型字典类型及操作字典类型定义- 字典类型是映射的体现- 映射是一种键(索引)和值(数据)的对应- 字典是键值对的几个键值对之间无序- 采用大括号和dict()创建键值对用冒号:表示字典类型的用法- 值 = 字典变量[键]- 字典变量[键] = 值字典处理函数及方法jieba库的使用jieba库基本介绍- 中文分词第三方库- 需要额外安装jieba库的安装-(cmd命令行)pip install jiebajieba分词原理- 利用一个中文词库确定汉字之间的关联概率- 汉字概率大的组成词组形成分词结果- 除了分词用户还可以添加自定义的词组jieba库使用说明- 分词三种模式精确模式:把文本精确的切分开不存在冗余单词全模式:把文本中所有可能的词语都扫描出来有冗余搜索引擎模式:在精确模式基础上对长词再次切分-jieba库常用函数文本词频统计实例Hamlet英文词频统计实例#Hamlet英文词频统计def get_text(): txt = open("D:\hamlet.txt", "r").read() #打开并读取文档内容 txt = txt.lower() #所有单词小写 for ch in ' !"#$%&()*+,-./:;<=>?@[\\]^_‘{|}~ ': #遍历所有符号 txt = txt.replace("ch", " ") #所有符号换成空格 return txthamlet_txt = get_text()words = hamlet_txt.split() #用空格分隔所有单词counts = {} #创建空字典for word in words: counts[word] = counts.get(word, 0) + 1 #创建单词和数量键值对计数items = list(counts.items())items.sort(key = lambda x:x[1], reverse = True) #降序排列for i in range(10): word, count = items[i] print("{0:<10}{1:>5}".format(word, count))三国演义人物出场统计#三国演义人物出场统计import jiebatxt = open("D:/threekingdoms.txt", "r", encoding = "utf-8").read()words = jieba.lcut(txt)counts = {}for word in words: if len(word) == 1: continue else: counts[word] = counts.get(word, 0) +1items = list(counts.items())items.sort(key = lambda x:x[1], reverse = True)for i in range(15): word, count = items[i] print("{0:<10}{1:>5}".format(word, count))(完)
《jmcomicron.mic天堂官网传送门:漫画世界的新视界-漫漫...》视频说明:就像半途入坑的切鸽她只是一个普通的哈利波特迷在购买IP周边期间入手了最喜欢角色的乐高小人仔渐渐不知怎的屋子里就摆满乐高装置了34家预亏超10亿元
2024-11-02 19:03:01