博客
关于我
用iApp写爬虫(手动滑稽)
阅读量:322 次
发布时间:2019-03-04

本文共 606 字,大约阅读时间需要 2 分钟。

安卓和iOS的出现使得J2ME平台上的移动端游戏逐渐退出历史舞台。为了在这些平台关闭之前抓取所有相关资源,我们需要从7723等平台开始整理。目标是收集游戏名称、类型、语言、更新时间、介绍、图标、截图(支持多种格式)以及jar、sis、six格式的软件包等资料,最终形成一个完整的游戏文件夹,总体容量达到75GB。

1. 获取HTML页面

首先,找到对应游戏的HTML页面。通过分析页面结构,可以提取游戏的核心信息,为后续处理打下基础。

2. 创建界面

设计一个用户友好的界面,包含文本框和按钮,用于输入序号以便定位具体内容。

3. 编写抓取逻辑

在按钮点击事件中,实现游戏信息的抓取逻辑。具体步骤包括:

  • 获取名称:通过提取页面标题和元数据获取游戏名。
  • 获取类型、语言和更新时间:从页面中筛选相应信息。
  • 获取介绍:提取游戏介绍文本。
  • 获取评论:解析评论列表,提取用户名、时间和内容。
  • 获取图标和截图:分别下载并存储不同格式的图标和截图。
  • 获取下载链接:提取游戏的下载地址,并处理不同版本的文件。

4. 处理文件存储

创建文件夹命名规则,包含游戏名、类型、语言、编号和更新日期。文件夹内整合以下内容:

  • 介绍文本
  • 更新日期
  • 介绍图和截图
  • 各分辨率版本(如触屏)
  • 评论

5. 文件预览

通过模拟器预览抓取的游戏文件,确保文件完整性和可用性。

注意事项

由于软件是基于模拟器运行的,请确保路径设置正确,以避免文件存取错误。

转载地址:http://ofwh.baihongyu.com/

你可能感兴趣的文章
phpstorm中Xdebug的使用
查看>>
phpstorm中使用svn版本控制器
查看>>
phpstorm配置php脚本执行
查看>>
PhpStorm配置远程xdebug
查看>>
phpStudy安装教程
查看>>
phpunit
查看>>
phpWhois 项目推荐
查看>>
phpwind部署问题
查看>>
PHP__call __callStatic
查看>>
php一句话图片运行,【后端开发】php一句话图片木马怎么解析
查看>>
php上传文件找不到临时文件夹
查看>>
PHP下curl用法分析
查看>>
php与web服务器关系
查看>>
redis事务操作
查看>>
PHP中array_merge和array相加的区别分析
查看>>
PHP中dirname(__FILE__)的意思
查看>>
PHP中extract()函数的妙用
查看>>
PHP中implode()和explode()
查看>>
PHP中serialize和json序列化与反序列化的区别
查看>>
Redis事务处理
查看>>