常见数据格式和分析¶
Dataframe¶
创建Dataframe¶
import pandas as pd
l1 = [1,2,3,4]
l2 = ['a','b','c','d']
dict1 = {'A':l1,'B':l2}
df = pd.DataFrame(dict1)
df
Dataframe 读入读出¶
如何知道分隔符?
用 vi 打开文件(但是要加载整个文件,可能会很慢)
读取前几行/后几行¶
行列操作¶
选择列¶
筛选¶
合并表格¶
pd.merge()
sub1 = df.iloc[0:2,0:1]
sub2 = df.iloc[0:2,1:2]
pd.merge(sub1,sub2,how='left',left_on='A',right_on='A')
# how='left': 只使用左表的键
# how='inner'(默认): 使用两个表的键的交集
# how='outer': 使用两个表的键的并集
# left_on:
pd.concat()
直接拼接