楼主: jy02368333
1304 7

[有偿编程] 一个关于算法的很麻烦的编程 [推广有奖]

  • 0关注
  • 0粉丝

本科生

45%

还不是VIP/贵宾

-

威望
0
论坛币
1414 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
1 点
经验
1129 点
帖子
79
精华
0
在线时间
100 小时
注册时间
2009-10-26
最后登录
2020-2-16

3000论坛币
需要用sas编写程序如下:


1,在100万个数据点的数据库中定义100个观测点,所以每个观测点就有1万个数据点,每一个观测点来估计用了好长的时间。

2.观察前5个点,然后通过找打最大的R^2来找到一个回归函数,(1) 线性回归 (2) log线性回归, (3) 二次回归, (4) 三次回归 (5) 指数回归


3.对于第6个点来说,做一个预测,在代码还在运行的时候,把剩余的时间显示出来。这个可以类似:在前6个观测点中,它看起来这个代码会在7:04到7:08之间结束。
4.随着程序的运行调整预测值。这意味着当有新的点加入的时候你每次都需要重新调整预测值。
5.继续做这个,直到做到了99个观测点。预测第100个就很简单了。




大概意思就是;用一个程序展示另外一个程序(比如proc sort)需要跑多少时间,然后在另外一个程序还在跑的过程中,适时的更新剩余时间,像迅雷那样


关键词:线性回归 二次回归 编写程序 观测点 预测值 数据库 最大的 迅雷 程序
沙发
fangwz 发表于 2013-6-9 09:18:57 |只看作者 |坛友微信交流群
LZ应该说一下是用什么软件,不过这个算法是很难实现的,迅雷能实现是通过剩余未下载流量和下载速度相比获得,而你的程序会收到运行过程占用内存等等的影响,据我在matlab的测试结果来看,同一个语句在不同环境下运行的结果会不同,尽管差别不大,但程序一多累积误差不可小觑,再者,对于一些优化算法,你不知道什么时候会收敛到满意值,是不可能获得剩余时间的,仅供参考

使用道具

藤椅
jy02368333 发表于 2013-6-9 09:22:07 |只看作者 |坛友微信交流群
fangwz 发表于 2013-6-9 09:18
LZ应该说一下是用什么软件,不过这个算法是很难实现的,迅雷能实现是通过剩余未下载流量和下载速度相比获得 ...
需要用sas,我加上了哈。好的,谢谢了哈。

使用道具

板凳
lynette_89 发表于 2013-6-9 09:51:41 |只看作者 |坛友微信交流群
这个算法确实比较复杂,偶也菜鸟一只,看看有没有大神回复~

使用道具

报纸
zkymath 在职认证  发表于 2013-6-9 11:04:10 |只看作者 |坛友微信交流群
用sas太繁琐了,改投门派吧! 统计分析还不错,其他它 不擅长

使用道具

地板
bobguy 发表于 2013-6-10 04:51:31 |只看作者 |坛友微信交流群
I don't understand the problem yet. But a simple regression with 100*10000 and 10 regressor takes about 2.12 seconds as showed below. I don't this time is a problem here.

47   data t1;
48     array x(10) ;
49     do i=1 to 100*10000;
50       do j=1 to 10;
51          x[j]=rannor(123);
52       end;
53       y=1+sum(of x[*]) + rannor(123);
54       output;
55     end;
56     keep y x:;
57   run;

NOTE: The data set WORK.T1 has 1000000 observations and 11 variables.
NOTE: DATA statement used (Total process time):
      real time           1.39 seconds
      cpu time            1.40 seconds

58
59   proc reg data=t1;
60   model y=x1-x10;
61   run;
62   quit;

NOTE: PROCEDURE REG used (Total process time):
      real time           5.70 seconds
      cpu time            2.12 seconds

使用道具

7
zhengbo8 发表于 2013-6-11 13:28:02 |只看作者 |坛友微信交流群
给个100W数据,附件。

使用道具

8
jy02368333 发表于 2013-6-11 15:15:10 |只看作者 |坛友微信交流群
zhengbo8 发表于 2013-6-11 13:28
给个100W数据,附件。
额,只是假设,就只是想编这个和算法相关的。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 12:28