爬虫能用到,将爬到的字典转为dataframe格式_了因和尚的博客-程序员宅基地

import pandas as pd                         #导入pandas包
data = pd.read_csv("2.csv")             #读取csv文件
#print (data.head(5))
#print(data.columns)
#print(data.shape)
order = ['time', 'match', 'home', 'score', 'nohome', 'first_half']
data=data[order]
#print (data['score'])






def getlistnum(li):  # 这个函数就是要对列表的每个元素进行计数
    li = list(li)
    #print(li)

    set1 = set(li) # 利用集合  把列表中重合的数据删掉
    #print("78787878")
    #print(set1)
    dict1 = {}
    dict3={}
    for item in set1:
        #dict1.update({item: li.count(item)})
        dict3.update({item:li.count(item)/215})
    return dict3
#print("**************")
#print(df[1])
#print("******")
col_count = getlistnum(data["score"])  # df[0]指列名为0的列,如果你的列名是字符串就要加引号

print(col_count)
dict=pd.DataFrame.from_dict(col_count,orient='index',columns=['score'])
dict=dict.reset_index().rename(columns={'index':'goal'})
dict.head()
print(dict)

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq_31904559/article/details/90609561

智能推荐

REST API_我有一個夢想的博客-程序员宅基地

如果你看到这里,你以前可能听说过API 和REST,然后你就会想:“这些都是什么东西?”。也许你已经了解过一些这方面的知识,但却不知道从何入手。在这个教程中,我将会诠释REST的基础以及如何给应用创建一个API(包括认证授权)。什么是API?API是Application Programming Interface(应用程序接口)的缩写,它是拿来描述一个类库的特征或是如何去运用它。你个...

mysql根据bin log恢复_MySQL通过Binlog恢复删除的表_张盼锋的博客-程序员宅基地

查看log-bin是否开启:mysql> show variables like '%log%bin%';+---------------------------------+-------+| Variable_name | Value |+---------------------------------+-------+| log_bin ...

Android加载/处理超大图片神器!SubsamplingScaleImageView(subsampling-scale-image-view)【系列1】..._weixin_30778805的博客-程序员宅基地

Android加载/处理超大图片神器!SubsamplingScaleImageView(subsampling-scale-image-view)【系列1】Android在加载或者处理超大巨型图片(x MB量级起步的图片)是一件非常需要小心谨慎的活儿,除了常规的OOM,其他需要处理的细节地方还很多,幸好开源社区github贡献了一套神器:SubsamplingScaleIma...

USB 设备插拔事件处理_weixin_30549175的博客-程序员宅基地

Windows 系统下,设备连接至电脑或从电脑移除,系统会广播一条 WM_DEVICECHANGE 消息到所有应用程序,在程序的消息处理函数中可以对事件进行相应。 1: class CMainDlg : public CDialogImpl<CMainDlg> { 2: public: ...

Manacher模板基础题_发型睡姿决定的博客-程序员宅基地

吉哥系列故事——完美队形II HDU - 4513【题目大意】求最长回文队伍且队伍由中间向两边递减。【思路】和字符串一样的做法,在递推的时候增加判断条件:a[i-p[i]]<=a[i-p[i]+2]。#include<iostream>#include<stdlib.h>#include<stdio.h>#include<cmath&...

支持Python!Facebook开源预测工具Prophet_weixin_34198762的博客-程序员宅基地

Facebook 表示,Prophet 相比现有预测工具更加人性化,并且难得地提供 Python 支持。另外,它生成的预测结果足以和专业数据分析师媲美。Facebook 把预测任务的流程用下图展示出来:从图中可以看出,预测共分四个流程:建模,预测评估,表面问题和人工检查。在建模阶段,当前可用的 Python 工具包寥寥无几。最广为人知的 “ f...

随便推点

php生成excel文件_璀璨星空fly的博客-程序员宅基地

<?php function createExcel($list, $indexKey, $filename = "", $startRow = 1, $excel2007 = false){ require_once APPLICATION_PATH . '/PHPExcel/PHPExcel.php'; require_once APPLICATION_PATH . ...

监控系统状态,以及zabbix监控_chouzhengzi6121的博客-程序员宅基地

1、监控linux系统状态(CPU/内存)2、监控linux系统状态(磁盘)3、监控linux系统状态(监控网卡流量)4、监控linux系统状态(进程)5、监控linux系统状态(抓包)6、监控介绍7、监控zabbix安装8、客户机安装zabbix9、zabbix邮件告警10...

【FFmpeg】FFmpeg常用基本命令_奋斗威威的博客-程序员宅基地

【FFmpeg】FFmpeg常用基本命令 1.分离视频音频流ffmpeg -i input_file -vcodec copy -an output_file_video  //分离视频流ffmpeg -i input_file -acodec copy -vn output_file_audio  //分离音频流2.视频解复用ffmpeg –i test.mp4 –vcodec copy –a...

c语言元素累积的计算,C语言:计算输出给定数组中每相邻两个元素的平均值的平方根之和。..._敌军头目的博客-程序员宅基地

//计算输出给定数组中每相邻两个元素的平均值的平方根之和。#include #include double fun(double x[]){double a,b,s=0.0;for (int i = ; i < ;){//a = (x[i++] + x[i]) / 2;//不可以这样使用,同一条语句中,i相当于还没有改变。a = x[i];a+=x[++i];a /= ;b = sqrt...

gulp-imagemi[email protected] 不能用来找我_嘴巴嘟嘟的博客-程序员宅基地

打包图片的常见使用package.json最新版本都是使用 ES6 模块,如果本地使用的require()的话,两个用法不一致导致会出现问题,不如都使用ES6模块,只需要在package.json 添加"type": "module"即可。{ "name": "img", "version": "1.0.0", "description": "", "main": "gulpfile.js", "scripts": { "test": "echo \"Error: no

推荐文章

热门文章

相关标签