博客
关于我
用iApp写爬虫(手动滑稽)
阅读量:322 次
发布时间:2019-03-04

本文共 8968 字,大约阅读时间需要 29 分钟。

在安卓和ios出现以前,移动端的游戏主要来自J2ME平台,但随着安卓与ios的出现,这种平台上的游戏逐渐没落,很多提供相关游戏资源下载的网站相继关闭。所以,我打算在所剩不多的游戏网站关闭之前,抓取所有与游戏相关的资源。以7723为例,我们要抓取的内容包括游戏名称、游戏类型、语言、更新时间、游戏介绍、游戏图标、游戏截图(jpg、png、gif)、游戏评论、以及相应的jar、sis、six格式的软件包,以此形成一个资料详细完整的游戏文件夹,资源总大小75G。

实例链接:

1.首先找到对应内容的HTML页面,如下图所示。

 

 

简单分析一下页面的html代码结构就可以开始写啦。 

2.创建图形界面,文本框及按钮对应序号如右图所示。

3. 代码部分,写在按钮5点击事件中。

ug(3,"text",st)ug(4,"text",en)sss en = ent(){  //软件总数12216 设为变量javanum  //文件名规则:1.文件名=分辨率  //2.创建文件夹命名规则=游戏名+类型+语言+编号+更新日期  //3.文件夹内包括游戏=游戏介绍文本+更新日期+介绍图+截图+各分辨率版本(触屏)+评论  s javanum = st  w(javanum!=en)  {    ufnsui()    {      ss("下载到:" + javanum,xzd)      us(7,"text",xzd)    }            syso(javanum)    s downloadaddf="http://www.7723.cn/download/"    s downloadaddb=".htm"    ss(downloadaddf + javanum + downloadaddb,add)    hs(add,origin)      w(origin==null)    {        s(javanum+1,javanum)         s downloadaddf="http://www.7723.cn/download/"        s downloadaddb=".htm"        ss(downloadaddf + javanum + downloadaddb,add)        hs(add,origin)        f(javanum>=en)        {          end()        }    }  //第一步:获取应用名name      siof(origin,"",name1)      s(name1 + 50,name11)      ssg(origin,name1,name11,namep)      siof(namep,"_",name2)      ssg(namep,7,name2,name)      sr(name,":",":",name)      sr(name,"*"," ",name)      sr(name,"?","",name)  //第二步:获取游戏类型、语言、以及更新日期      //1.得到类型type      siof(origin,"
类型",type1)      s(type1+150,type11)      ssg(origin,type1,type11,typep)      siof(typep,"
",type2)      ssg(typep,7,type2,type)      s(type2 + 6,type2)      ssg(typep,type2,typep)    //2.得到语言language      siof(typep,"
语言",language1)      s(language1 + 7,language1)      siof(typep,"
",language2)      ssg(typep,language1,language2,language)      s(language2 + 6,language2)      ssg(typep,language2,languagep)      //3.得到更新日期date      siof(languagep,"更新日期",date1)      s(date1 + 5,date1)      siof(languagep,"\n",date2)      ssg(languagep,date1,date2,date)  //第三步:获取游戏介绍introduce      s sign="
"      siof(origin,sign,introduce1)      s(introduce1 + 500,introduce2)      s(introduce1 + 24,introduce1)      ssg(origin,introduce1,introduce2,introducep)      siof(introducep,"
",introducepl)      ssg(introducep,0,introducepl,introduce)  //第四步:获取评论commentall      s sign = "

",cuttext)      s(cuttext + 20,cuttext)      ssg(gamedownloadtext,cuttext,gamedownloadtext)      siof(gamedownloadtext,"

",gamedownloadtypest)      s(downnum+1,downnum)      }        //ufnsui()//  {  //  us(1,"text",gameadd) // }    stop(3000)  s(javanum + 1,javanum)  }        }

 4. 文件预览:

注意:由于软件是用模拟器跑的,所以使用时注意更改路径。

转载地址:http://ofwh.baihongyu.com/

你可能感兴趣的文章
MySQL不会性能调优?看看这份清华架构师编写的MySQL性能优化手册吧
查看>>
MySQL不同字符集及排序规则详解:业务场景下的最佳选
查看>>
Mysql不同官方版本对比
查看>>
MySQL与Informix数据库中的同义表创建:深入解析与比较
查看>>
mysql与mem_细说 MySQL 之 MEM_ROOT
查看>>
MySQL与Oracle的数据迁移注意事项,另附转换工具链接
查看>>
mysql丢失更新问题
查看>>
MySQL两千万数据优化&迁移
查看>>
MySql中 delimiter 详解
查看>>
MYSQL中 find_in_set() 函数用法详解
查看>>
MySQL中auto_increment有什么作用?(IT枫斗者)
查看>>
MySQL中B+Tree索引原理
查看>>
mysql中cast() 和convert()的用法讲解
查看>>
mysql中datetime与timestamp类型有什么区别
查看>>
MySQL中DQL语言的执行顺序
查看>>
mysql中floor函数的作用是什么?
查看>>
MySQL中group by 与 order by 一起使用排序问题
查看>>
mysql中having的用法
查看>>
MySQL中interactive_timeout和wait_timeout的区别
查看>>
mysql中int、bigint、smallint 和 tinyint的区别、char和varchar的区别详细介绍
查看>>