去看一下第三课教程,边看视频边操作,一般一次就能跟上
我先抛砖引玉一下,说下个人的理解。把excel中的数据导入python的过程可以看作是从excel导入csv文件的过程,即做以下转换:
1、将文件中的内容转换为结构化的、数字格式的转换向量;
2、对比python的处理的结果,找出有差异的地方;
3、根据自己的需要,自定义格式化的结果;
4、自定义excel的解析器;
5、利用pandas的数据处理功能、pandas的函数、pandas的数据结构组合自己的数据格式转换,制作特定格式的excel文件;
7、利用excel中已有的数据制作相应的dataframe,最后存入mysql等其他数据库中,形成自己的数据科学项目日上午(春节前三天)的python课上,老师用的开源工具叫pandas,数据是excel2016版本,原来我把excel2016版本所有行填充为row也是2013版本填充为row,现在我通过使用pandas转化了这个row格式的,方法跟方法1大同小异,简单说下我用的公式步骤:1,先填充row,如下图,填充语句为再填充row,如下图,填充语句为查看数据差异用打开这个excel,选中一列,添加strings,选中上方第一个,添加一个别名为确定输出hello,点击确定,然后选择数据,再选择列,选择column,选择rows,确定输出,可看到行列都是excel里面row,问题解决。
第一步,我们制作一个excel文件(按照自己电脑操作环境来制作,这里我选用2010版本)第二步,利用pandas库来处理这个excel,步骤如下:一,抓取所有的数据。二,excel2016版本,我只能使用图像化工具插入的方式插入二维表格,如下:
用pandas解析二维表格,然后再根据excel数据自己转换一