Python 基础
常见数据格式和处理¶
List¶
- 可由不同类型元素组成
- 可以嵌套
- index 从 0 开始
- 调用方便
-
可以修改
几个内置函数¶
max()
min()
len()
sum()
np.mean()
np.std()
数学运算¶
split()
sentences = ['I am a student',
'You are a teacher',
'He is a doctor']
words = [lines.split() for lines in sentences]
print(words)
# [['I', 'am', 'a', 'student'], ['You', 'are', 'a', 'teacher'], ['He', 'is', 'a', 'doctor']]
摆脱嵌套:
Tuple¶
- 用
()
表示 - 性质和 List 类似
- 不可修改
- 快
Dict¶
- 用
{}
表示 - key-value
- 无序
texts = ["中文处理"]
vocab=[list(i) for i in texts]
#enumerate重要功能,返回index和内容
vocab_dict = {k:i for i,k in enumerate(sum(vocab,[]))}
print(vocab, "\n")
print(vocab_dict, "\n")
Set¶
集合的增删¶
集合运算¶
set1.union(set2) # 并集
set1 | set2
set1.intersection(set2) # 交集
set1 & set2
set1.difference(set2) # 差集
set1 - set2
set1.symmetric_difference(set2) # 对称差
set1 ^ set2
e.g.
DataFrame¶
创建表格¶
zip()
同时遍历两个列表。若长度不同,在最短的停止。
忠告
做数值计算千万不要用 list
,而是要用 NumPy 的 array
,不然消耗的是电脑的内存和电力以及自己的精力!
帮同学解决某爆内存的屎山代码后的感想