楼主: jerker
15169 61

[讨论交流] [Python]在Python中利用Pandas库处理大数据的简单介绍 [推广有奖]

已卖:115份资源

学术权威

80%

还不是VIP/贵宾

-

TA的文库  其他...

数据科学(Data Science)

威望
6
论坛币
50722 个
通用积分
554.7265
学术水平
3272 点
热心指数
3508 点
信用等级
3023 点
经验
532 点
帖子
5802
精华
28
在线时间
3532 小时
注册时间
2009-11-19
最后登录
2025-6-30

初级学术勋章 中级热心勋章 初级热心勋章 初级信用勋章 中级学术勋章 高级学术勋章 特级学术勋章 高级热心勋章 特级热心勋章 中级信用勋章 高级信用勋章 特级信用勋章

楼主
jerker 发表于 2015-4-10 09:34:37 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
QQ截图20150410093203.png    
【在Python中利用Pandas库处理大数据的简单介绍】只有在超过5TB数据量的规模下,Hadoop才是一个合理的技术选择。这次拿到近亿条日志数据,千万级数据已经是关系型数据库的查询分析瓶颈,之前使用过Hadoop对大量文本进行分类,这次决定采用Python来处理数据。


这篇文章简单介绍了在Python中利用Pandas处理大数据的过程,Pandas库的使用能够很好地展现数据结构,是近来Python项目中经常被使用使用的热门技术,需要的朋友可以参考下
在数据分析领域,最热门的莫过于Python和R语言,此前有一篇文章《别老扯什么Hadoop了,你的数据根本不够大》指出:只有在超过5TB数据量的规模下,Hadoop才是一个合理的技术选择。这次拿到近亿条日志数据,千万级数据已经是关系型数据库的查询分析瓶颈,之前使用过Hadoop对大量文本进行分类,这次决定采用Python来处理数据:
    硬件环境
        CPU:3.5 GHz Intel Core i7
        内存:32 GB HDDR 3 1600 MHz
        硬盘:3 TB Fusion Drive
    数据分析工具
        Python:2.7.6
        Pandas:0.15.0

        IPython notebook:2.0.0


本帖隐藏的内容

在Python中利用Pandas库处理大数据的简单介绍.docx (216.39 KB)


信息来源:脚本之家

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:python pandas panda Das 大数据 数据库 文章 朋友 规模 技术

已有 3 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
421073390 + 20 精彩帖子
oink-oink + 2 + 2 + 2 精彩帖子
fantuanxiaot + 56 + 49 + 1 + 1 + 1 精彩帖子

总评分: 经验 + 76  论坛币 + 49  学术水平 + 3  热心指数 + 3  信用等级 + 3   查看全部评分

本帖被以下文库推荐

沙发
auirzxp 学生认证  发表于 2015-4-10 09:38:16
提示: 作者被禁止或删除 内容自动屏蔽

藤椅
jerker 发表于 2015-4-10 09:40:10
auirzxp 发表于 2015-4-10 09:38

板凳
auirzxp 学生认证  发表于 2015-4-10 09:41:17
提示: 作者被禁止或删除 内容自动屏蔽

报纸
auirzxp 学生认证  发表于 2015-4-10 09:42:03
提示: 作者被禁止或删除 内容自动屏蔽

地板
斯男 发表于 2015-4-10 09:55:54
用SPSS能进行多大规模的数据处理?

7
utena 发表于 2015-4-10 09:59:52
[handshake][em49]

8
jerker 发表于 2015-4-10 10:13:22
斯男 发表于 2015-4-10 09:55
用SPSS能进行多大规模的数据处理?
兄台参阅
http://www.ibm.com/developerwork ... /bd-spss/index.html

9
rrjj101022 发表于 2015-4-10 10:52:48
谢谢分享~~~

10
jerker 发表于 2015-4-10 10:57:14
rrjj101022 发表于 2015-4-10 10:52
谢谢分享~~~

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jr
拉您进交流群
GMT+8, 2025-12-30 02:53