1525 0

[生活百科] 【大数据·职场人生】数据迁移工作总结 [推广有奖]

企业贵宾

巨擘

0%

还不是VIP/贵宾

-

威望
4
论坛币
624047 个
通用积分
147.7393
学术水平
918 点
热心指数
987 点
信用等级
841 点
经验
398782 点
帖子
9795
精华
48
在线时间
17322 小时
注册时间
2014-8-19
最后登录
2022-11-2

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

     【大数据·职场人生】数据迁移工作总结


        这两天,公司项目的excel模块需要重构,需要对历史数据进行迁移。


        公司最近几次重大功能的上线,都涉及到数据迁移问题。可以说数据迁移是产品上线之前,重要的一个环节。数据迁移一般涉及的问题较多,不单单是数据位置的变动,更多的是数据格式要变化。


        这两天我的任务就是根据原有的四个数据库表合成新的三张数据库表,同时将历史的excel数据格式进行转换,存储的MongoDB中。这数据迁移的过程中,还是有很多问题需要注意的。


        首先,就是数据迁移时间问题。数据迁移尽量要在短时内搞定,因为只有在短时间内搞定,才可以保证用户不会有新的数据在这段时间内写入旧的系统。只有这样,产品上线后,数据才会保证一直。线上数据迁移我做了两次,第一次使用单线程的方式,对线上数据进行迁移。7个小时内都没有迁移完历史数据,这个时候,又有大量的新数据写入,所以很蛋疼。后才采用多进程方式,利用Redis做队列,实现多进程并发迁移数据。找了一个用户上传excel数量少得时间段进行迁移数据,大约一个小时搞定。这段时间内用户只上传了几个excel,然后再对这几个excel迁移。保证了上线之前,数据的可靠性。


        第二,一般数据迁移都会花时间,数据量大,时间更长,因此必须在真正的迁移之间,多次试验。首先我对线下的数据,采取少量的excel做功能试验。保证数据迁移功能是正确地。然后对线下的所有数据进行数据迁移,根据数据量的大小和迁移时间,以此来评估迁移线上数据需要多长时间。然后对线上数据做迁移,来验证数据的正确性。只有正确之后,才能找个合适的时间,对历史数据进行全量迁移。


         这次数据迁移,自己也学到了不少东西。数据,毫无疑问,对所有系统来说都是至关重要的。所以,一定要保证数据迁移的正确性。宁愿产品上线比预期完一点,也要保证数据迁移的正确性。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据迁移工作总结 工作总结 职场人生 数据迁移 大数据 【大数据·职场人生】数据迁移工作总结 数据迁移工作总结


https://www.cda.cn/?seo-luntan
高薪就业·数据科学人才·16年教育品牌
您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-6-16 23:10