如果遇到csv文件不是以逗号分隔,也不是以一个空格分隔,也不是 \t 分隔,
但是又是有规律的分隔,就像下面这种
查看官方文档
官方文档:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
里面提到可以修改sep参数为正则表达式来作为分隔符
所以如果csv文件内容长这样:
可以修改sep参数为r'\s+'
或者r'\s{2,}'
也就是说可以这样来读取文件
import pandas as pd
data=pd.read_csv('research_data_youtube_1.csv',sep=r'\s{2,}')
或者这样读取
import pandas as pd
data=pd.read_csv('./oss_results/research_data_youtube_1.csv',sep=r'\s+')
可以去掉索引,看的更方便
df = data.reset_index(drop=True)