还是pandas读取CSV文件最方便啦!
简单示例:
Import pandas as pd
data = pd.read_csv(file,engine='python')
x_data=data['Tweet'].values.tolist()
下面简要介绍read_csv函数,就罗列了几个我看到有用的参数,如果看到新的会更新
其实就是翻译了一下官网,如有错误请各位大佬指正:
详细介绍官网网址:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
pandas.read_csv(filepath_or_buffer: Union[str, pathlib.Path, IO[~AnyStr]], sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, skipfooter=0, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, cache_dates=True, iterator=False, chunksize=None, compression='infer', thousands=None, decimal: str = '.', lineterminator=None, quotechar='"', quoting=0, doublequote=True, escapechar=None, comment=None, encoding=None, dialect=None, error_bad_lines=True, warn_bad_lines=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None)[source]
参数说明:
Filepath_or__buffer:一定要有的参数,写在第一个,可以是路径,可以是网址,可以是对象(需要有read()方法)
engine:{‘c’, ‘python’}, 可选
————————其他都可有可无啦——————
Sep/delimiter:分隔符,默认是','(根据介绍python引擎可以自动发现分隔符)
header:int, list of int, default ‘infer’:
列名称。
不填的话是默认自动识别,如果没有的话可以写header=None