pandas DataFrame方法;dataframe 定义一个数值全为1的列;dataframe创建多列;如何拆分嵌套list存为dataframe;在数据集添加一个新的列_test = pd.dataframe(columns=['2'],-程序员宅基地

技术标签: 数据分析  Pandas  数据挖掘  Python  

主题:记录pandas的常见建立dataframe方法

一、pd.DataFrame()方法(创建1列的情景)

(1)传入pd.DataFrame()的内容,是一个dict(字典)

(2)在原有数据集上添加某个列和值

-------->数据集名['列名']=传入自定义的list

-------->数据集名['列名A']=pd.DataFrame(data=数据集名['列名B']) ,其中data参数可省略

即<==>数据集名['列名A']=pd.DataFrame(数据集名['列名B'])

将后者的数值(value)赋给其他数据集或列

import pandas as pd
datas=pd.DataFrame({'出场顺序':['1','2','3','4'],'打分等级':['A','B','C','D']})
datas['是否出场']=['是' for i in range(4)]
datas['出演人数']=[1 for i in range(4)]
datas['本地人']=pd.DataFrame(data=['是','否','是','否'])
datas['非外国人']=pd.DataFrame(data=datas['本地人'])
#datas['非外国人']=pd.DataFrame(datas['本地人'])
datas

结果如图:

(3)pd.DataFrame()独立创建1列

 ----->  I.用dataframe的定义

list=['aa','AA','Aa','aA']
data=pd.DataFrame({'生物基因组合':list})

------->II 传参数方法

list=['aa','AA','Aa','aA']
data=pd.DataFrame(list,columns=['生物基因组合'])

     这里需留意,如果columns参数没有添加中括号,即代码:data=pd.DataFrame(list,columns=['生物基因组合']),将报错

Index(...) must be called with a collection of some kind, 'xxx'(列名) was passed

(4)将创建的新数据列直接放在某个数据列后面(前提:行数一致),采用pd.concat()方法

data_result=pd.concat([datas,data],axis=1)
#data_result

结果:

二、pd.DataFrame()方法(创建多列的情景)

(1)传入pd.DataFrame()的内容,是一个dict(字典),在字典里体现多列

(2)默认添加数据是按行添加

list_x=[1,3,4]
list_y=[1,9,16]
data_demo=pd.DataFrame(data=[list_x,list_y],columns=['第一列','第二列','第三列'])
data_demo

结果:

(3)通过pd.DataFrame()创建多列,按列添加数据

list_x=[1,3,4]
list_y=[1,9,16]
data_test=pd.DataFrame([list_x,list_y]).T
data_test.rename(columns={0:'第一列',1:'第二列'},inplace=True)

结果:

 三、将嵌套的list拆分成不同列,存为dataframe

import pandas as pd
arr=[[2,8],[3,27],[4,64]] #list
#arr[0][0]=2,arr[1][0]=3,arr[2][0]=4
#arr[0][1]=8,arr[1][1]=27,arr[2][1]=64
list_X=[]
list_Y=[]
for i in range(len(arr)):
    list_X.append(arr[i][0])
    list_Y.append(arr[i][1])
# list_X [2,3,4]
# list_Y [8,27,64]
result=pd.DataFrame({'横坐标': list_X,'纵坐标': list_Y})
result

结果包括两列:

      横坐标列为:2,3,4  ;纵坐标列为:8,27,64 

四、参考网址

Python报错TypeError: Index(...) must be called with a collection of some kind, ' ' was passed columns_给我一点温度-程序员宅基地https://blog.csdn.net/sinat_26811377/article/details/98741330

python数据拼接: pd.concat - boobo - 博客园1.concat concat函数是在pandas底下的方法,可以将数据根据不同的轴作简单的融合 参数说明 objs: series,dataframe或者是panel构成的序列lsit&#https://www.cnblogs.com/RB26DETT/p/11555099.html

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_43718742/article/details/121861911

智能推荐

Android音视频技术1--Android SurfaceView使用_surfaceview 首帧渲染回调-程序员宅基地

文章浏览阅读283次。开篇提到视频数据源渲染提到过SurfaceView,SurfaceView是Android提供的渲染图形类。一.SurfaceView简介Android平台图形渲染类。 主要由于游戏场景,适合频发绘制刷新的View。 Surfaceview可用于工作线程刷新View。 普通View为被动刷新,主动刷新则选择SurfaceView。二.SurfaceView与View的区别Sur..._surfaceview 首帧渲染回调

SpringMVC_@ControllerAdvice_springmvc controlleradvice-程序员宅基地

文章浏览阅读133次。SpringMVC_@ControllerAdvice一.全局异常处理二.全局数据绑定三.全局数据预处理新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表F..._springmvc controlleradvice

[LQR简要快速入门]+[一级倒立摆的LQR控制]-程序员宅基地

文章浏览阅读8k次,点赞34次,收藏127次。[LQR简要快速入门]+[一级倒立摆的LQR控制]1. 什么是LQR2. 公式含义3. 倒立摆的建模3.1 线性化3.2 状态空间建立4. LQR算法实现5. MATLAB代码仿真6. 优缺点1. 什么是LQRLQR是一种最优控制算法,简要讲即为寻求一种算法,使得在满足系统稳定性能的同时,系统在达到稳定的过程中消耗的能量也最少(具有实际意义)。利用最优控制理论的知识可以知道,既然要达到两个指标(1. 性能;2. 能量)的最优,可以很容易列出积分形式的最优指标:J=∫0∞(xTQx+uTRu)dt(1_lqr

anaconda: import numpy报错:ImportError: DLL load failed: 找不到指定的模块_anaconda import numpy 模块错误-程序员宅基地

文章浏览阅读795次。anaconda: import numpy报错:ImportError: DLL load failed: 找不到指定的模块在使用vscode 和anaconda时,在vscode中 import numpy,出现了以上报错可以查看是否未添加anaconda的环境变量具体参考如下文章,如何配置环境变量https://blog.csdn.net/Buster001/article/details/90025712..._anaconda import numpy 模块错误

c钩子库Minhook的使用_minihook使用 vs-程序员宅基地

文章浏览阅读5.4k次。简述最近在学习钩子库,逛了一下gay hub,发现了一个项目minhook,纯钩子库,甚合我意,就研究了一下,写了2个例子。后续打算研究一下这个钩子库的源代码,了解一下具体怎么实现的。例子例子就不贴到这上面了,给出github地址:minhook钩子库的使用示例例子vs2008编译通过,使用的dll,lib文件都是从minhook项目编译而来。minhook项目github地址..._minihook使用 vs

python 发布包_如何将自己的Python包发布到PyPI-程序员宅基地

文章浏览阅读150次。以前写过一篇类似的文章: 如何打包自己的项目并且发布到pypi上,不过由于PyPI进行了一些更新,因此旧方法不大适用了。趁端午有时间,想把haipproxy的客户端发布到PyPI,以改进用户体验,因此这次又尝试了如何将Python包发布到新版本的PyPI上。编写setup.py以haipproxy为例,它的setup.py如下from os import path as os_pathfrom s..._如何将python包推送到pipy

随便推点

RCE远程命令执行漏洞挖掘思路_rce漏洞挖掘-程序员宅基地

文章浏览阅读3.2k次,点赞3次,收藏19次。RCE漏洞存在的地方包括:在url参数上,文件下载处,在查看图片,查看文件等地方在文件删除上,SSRF可能存在的地方,变量参数提交的地方等_rce漏洞挖掘

[数据仓库]分层概念,ODS,DM,DWD,DWS,DIM的概念_ods层-程序员宅基地

文章浏览阅读10w+次,点赞118次,收藏518次。ODS是什么?ODS 全称是 Operational Data Store,操作数据存储.“面向主题的”,数据运营层,也叫ODS层,是最接近数据源中数据的一层,数据源中的数据,经过抽取、洗净、传输,也就说传说中的 ETL 之后,装入本层。本层的数据,总体上大多是按照源头业务系统的分类方式而分类的。但是,这一层面的数据却不等同于原始数据。在源数据装入这一层时,要进行诸如去噪(例如有一条数据中人的年龄是 300 岁,这种属于异常数据,就需要提前做一些处理)、去重(例如在个人资料表中,同一 ID 却有两条重复_ods层

Lucene介绍与使用-程序员宅基地

文章浏览阅读9.1w次,点赞237次,收藏928次。1、了解搜索技术1.1 什么是搜索简单的说,搜索就是搜寻、查找,在IT行业中就是指用户输入关键字,通过相应的算法,查询并返回用户所需要的信息。1.2 普通的数据库搜索类似:select * from 表名 where 字段名 like ‘%关键字%’例如:select * from article where content like ’%here%’结果: where here..._lucene

一个简单的协议定制_parseline-程序员宅基地

文章浏览阅读262次,点赞8次,收藏4次。socket、序列化和反序列化、自定义协议、一般服务器设计原则和各种场景_parseline

【RT-Thread】学习日记之系统节拍Tick_rt_tick_get-程序员宅基地

文章浏览阅读715次。RT-Thread 学习日记之系统节拍Tick_rt_tick_get

MySQL数据库——高级查询语句_mysql高级查询语句-程序员宅基地

文章浏览阅读5k次,点赞17次,收藏94次。数据库是用来存储数据,更新,查询数据的工具,而查询数据是一个数据库最为核心的功能,数据库是用来承载信息,而信息是用来分析和查看的。例:SELECT A.Store_Name Store, SUM(A.Sales) “Total Sales” FROM fxk003 A GROUP BY A.Store_Name;例:SELECT Store_Name, SUM(Sales) FROM fxk003 GROUP BY Store_Name HAVING SUM(Sales) > 1500;_mysql高级查询语句

推荐文章

热门文章

相关标签