签到
- 苹果/安卓/wp
- 苹果/安卓/wp
客户端
0.0

0.00

人大经济论坛 › 论坛 › 金融投资论坛六区 › 金融学（理论版） › 量化投资 › [Python]在Python中利用Pandas库处理大数据的简单介绍

CDA数据分析研究院

商业数据分析与大数据领航教育品牌



经管云课堂

经管/金融/财会/社科/名师公开课



学术培训

Stata 空间计量 SSCI Python

贵宾：通行论坛特权+数据库权限
+案例库+下载特权 VIP：论坛特权+更多下载次数
+ccerdata数据库+更高阅读权限+……

12 3 4 5 6 7 下一页

提升主题| 本版置顶| 关闭主题| 变更主题颜色| 抢沙发| 顶贴| 显身卡| 道具中心

楼主: jerker

13466 61

[讨论交流] [Python]在Python中利用Pandas库处理大数据的简单介绍 [推广有奖]

版主推荐

1关注
179
粉丝

学术权威

80%

还不是VIP/贵宾

-

TA的文库 其他...

数据科学（Data Science）

0%

威望: 6 级
论坛币: 50724 个
通用积分: 3489.0406
学术水平: 3272 点
热心指数: 3508 点
信用等级: 3023 点
经验: 406 点
帖子: 5811
精华: 28
在线时间: 3530 小时
注册时间: 2009-11-19
最后登录: 2024-3-27

楼主

jerker 发表于 2015-4-10 09:34:37 |只看作者 |坛友微信交流群|倒序 |AI写论文

相似文件

换一批

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

QQ截图20150410093203.png

【在Python中利用Pandas库处理大数据的简单介绍】只有在超过5TB数据量的规模下，Hadoop才是一个合理的技术选择。这次拿到近亿条日志数据，千万级数据已经是关系型数据库的查询分析瓶颈，之前使用过Hadoop对大量文本进行分类，这次决定采用Python来处理数据。

这篇文章简单介绍了在Python中利用Pandas处理大数据的过程,Pandas库的使用能够很好地展现数据结构,是近来Python项目中经常被使用使用的热门技术,需要的朋友可以参考下
在数据分析领域，最热门的莫过于Python和R语言，此前有一篇文章《别老扯什么Hadoop了，你的数据根本不够大》指出：只有在超过5TB数据量的规模下，Hadoop才是一个合理的技术选择。这次拿到近亿条日志数据，千万级数据已经是关系型数据库的查询分析瓶颈，之前使用过Hadoop对大量文本进行分类，这次决定采用Python来处理数据：
硬件环境
      CPU：3.5 GHz Intel Core i7
      内存：32 GB HDDR 3 1600 MHz
      硬盘：3 TB Fusion Drive
数据分析工具
      Python：2.7.6
      Pandas：0.15.0

      IPython notebook：2.0.0

本帖隐藏的内容

在Python中利用Pandas库处理大数据的简单介绍.docx (216.39 KB)

信息来源：脚本之家

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏11 回帖

关键词：python pandas panda Das 大数据数据库文章朋友规模技术

相关帖子

已有 3 人评分	经验	论坛币	学术水平	热心指数	信用等级	收起理由
421073390	+ 20					精彩帖子
oink-oink			+ 2	+ 2	+ 2	精彩帖子
fantuanxiaot	+ 56	+ 49	+ 1	+ 1	+ 1	精彩帖子

总评分: 经验 + 76 论坛币 + 49 学术水平 + 3 热心指数 + 3 信用等级 + 3 查看全部评分

本帖被以下文库推荐

· 数据科学（Data Science）|主题: 259, 订阅: 41
· 金融工程|主题: 8977, 订阅: 463
· 离歌||量化投资理论与实战|主题: 1297, 订阅: 627
· stata matlab python实战|主题: 240, 订阅: 69
· 量化投资|主题: 1040, 订阅: 162

回复

使用道具举报

沙发

学生认证

发表于 2015-4-10 09:38:16 |只看作者 |坛友微信交流群

回复

使用道具举报

藤椅

jerker 发表于 2015-4-10 09:40:10 |只看作者 |坛友微信交流群

auirzxp 发表于 2015-4-10 09:38

回复

使用道具举报

板凳

学生认证

发表于 2015-4-10 09:41:17 |只看作者 |坛友微信交流群

回复

使用道具举报

报纸

学生认证

发表于 2015-4-10 09:42:03 |只看作者 |坛友微信交流群

jerker 发表于 2015-4-10 09:40

回复

使用道具举报

地板

斯男 发表于 2015-4-10 09:55:54 |只看作者 |坛友微信交流群

用SPSS能进行多大规模的数据处理？

回复

使用道具举报

7楼

utena 发表于 2015-4-10 09:59:52 |只看作者 |坛友微信交流群

[handshake]

[em49]

回复

使用道具举报

8楼

jerker 发表于 2015-4-10 10:13:22 |只看作者 |坛友微信交流群

斯男发表于 2015-4-10 09:55
用SPSS能进行多大规模的数据处理？

兄台参阅
http://www.ibm.com/developerwork ... /bd-spss/index.html

回复

使用道具举报

9楼

rrjj101022 发表于 2015-4-10 10:52:48 |只看作者 |坛友微信交流群

谢谢分享~~~

回复

使用道具举报

10楼

jerker 发表于 2015-4-10 10:57:14 |只看作者 |坛友微信交流群

rrjj101022 发表于 2015-4-10 10:52
谢谢分享~~~

回复

使用道具举报

12 3 4 5 6 7 下一页

发帖

本版微信群

加好友,备注jr
拉您进交流群

如有投资本站、合作意向或投放广告，请联系：13661292478（刘老师）

联系客服

邮箱：service@pinggu.org 投诉或不良信息处理：（010-68466864）

京ICP备16021002-2号京B2-20170662号京公网安备 11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明