楼主: kychan
2187 18

[其它] Verification page [推广有奖]

区版主

泰斗

66%

还不是VIP/贵宾

-

TA的文库  其他...

学管理 • 学人生

每日股市

【KYCHAN文库】

威望
12
论坛币
1179179 个
通用积分
101682.8768
学术水平
15760 点
热心指数
16780 点
信用等级
14408 点
经验
679888 点
帖子
12357
精华
52
在线时间
10016 小时
注册时间
2013-4-2
最后登录
2025-12-8

初级热心勋章 中级热心勋章 高级热心勋章 初级学术勋章 中级学术勋章 高级学术勋章 初级信用勋章 中级信用勋章 高级信用勋章 特级热心勋章 特级学术勋章 特级信用勋章

楼主
kychan 学生认证  发表于 2015-9-29 18:26:02 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
需要检查30000 个 文档是否存在 , 一个一个检查太费时
帮帮看能能减轻我检查 URL activate or not?  30000 links 放进 .dat 来检查

搞个 Tools 也可 ?

url keyin and return.png

When i keyin url if there is a result , it will return like the pages below
Result Return1.png

if there is no result, the pages will return as below
Result ReturnError.png

Please help !

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Verification cation ATION CATI page return

不管你不喜欢我和不爱我

沙发
iRolly 发表于 2015-10-2 21:37:57
kychan 发表于 2015-9-30 17:44
logically , 输入 "https: ..... ano=292092" 将会显出 "https: ..... ano=292092" 不然就 "https:....  ...
你的意思是,输入网址,如果页面中出现“student details”就通过,反之页面中出现“unauthorized access”就不通过是吗?
我个人对php+mysql比较熟悉,不知道适不适合你
可以建一个数据库导入这30000条网址数据
然后写一个php代码,用file_get_contents($url);语句读取数据库中第一条网址页面中间的内容
用if判断内容将你需要的页面显示出来,或者对结果进行分类输出。
最后再循环,处理数据库中第二条网址……只到全部处理完。
不知道我这样说明白了么?
已有 1 人评分论坛币 收起 理由
kychan + 100 就是这样 。。。

总评分: 论坛币 + 100   查看全部评分

藤椅
记忆是搁浅 学生认证  发表于 2015-9-29 18:53:55
什么意思

板凳
Jealy 在职认证  发表于 2015-9-29 19:11:33
看不懂

报纸
iRolly 发表于 2015-9-30 15:53:11
意思看懂了,但是不知道楼主要查什么呢?
是地址打开以后的页面中间某个关键词么?还是仅仅是判断页面能不能正常访问?

地板
iRolly 发表于 2015-9-30 15:58:55
如果是搜索30000个页面中间的某个关键词
可以考虑写一个网络爬虫(蜘蛛)
让爬虫帮你搜索url以及中间内容
可以参考一下这篇文章
http://www.nowamagic.net/librarys/veda/detail/1045
已有 1 人评分论坛币 收起 理由
kychan + 10 这行不通

总评分: 论坛币 + 10   查看全部评分

7
kychan 学生认证  发表于 2015-9-30 17:44:47
iRolly 发表于 2015-9-30 15:53
意思看懂了,但是不知道楼主要查什么呢?
是地址打开以后的页面中间某个关键词么?还是仅仅是判断页面能不 ...
logically , 输入 "https: ..... ano=292092" 将会显出 "https: ..... ano=292092" 不然就 "https:.... status=unauth"  个人想法是 比较 尾端 292092是否一样  不果的就作错误status unauth

如果我将 "https: ..... ano=292092" 输入  做个工具, 找出 Status

8
kychan 学生认证  发表于 2015-10-2 22:38:17
iRolly 发表于 2015-10-2 21:37
你的意思是,输入网址,如果页面中出现“student details”就通过,反之页面中出现“unauthorized access ...
就是这样 .... 感谢 iRolly 的 热心  

9
iRolly 发表于 2015-10-3 23:44:06
kychan 发表于 2015-10-2 22:38
就是这样 .... 感谢 iRolly 的 热心
如果需要,数据不是保密信息,可以发给我试着帮你筛选。

10
kychan 学生认证  发表于 2015-10-5 19:27:09
iRolly 发表于 2015-10-3 23:44
如果需要,数据不是保密信息,可以发给我试着帮你筛选。
数据不是保密信息 但要该老师的ID/password 才能进入,我不方便给你

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-30 11:32