博客
关于我
用iApp写爬虫(手动滑稽)
阅读量:322 次
发布时间:2019-03-04

本文共 606 字,大约阅读时间需要 2 分钟。

安卓和iOS的出现使得J2ME平台上的移动端游戏逐渐退出历史舞台。为了在这些平台关闭之前抓取所有相关资源,我们需要从7723等平台开始整理。目标是收集游戏名称、类型、语言、更新时间、介绍、图标、截图(支持多种格式)以及jar、sis、six格式的软件包等资料,最终形成一个完整的游戏文件夹,总体容量达到75GB。

1. 获取HTML页面

首先,找到对应游戏的HTML页面。通过分析页面结构,可以提取游戏的核心信息,为后续处理打下基础。

2. 创建界面

设计一个用户友好的界面,包含文本框和按钮,用于输入序号以便定位具体内容。

3. 编写抓取逻辑

在按钮点击事件中,实现游戏信息的抓取逻辑。具体步骤包括:

  • 获取名称:通过提取页面标题和元数据获取游戏名。
  • 获取类型、语言和更新时间:从页面中筛选相应信息。
  • 获取介绍:提取游戏介绍文本。
  • 获取评论:解析评论列表,提取用户名、时间和内容。
  • 获取图标和截图:分别下载并存储不同格式的图标和截图。
  • 获取下载链接:提取游戏的下载地址,并处理不同版本的文件。

4. 处理文件存储

创建文件夹命名规则,包含游戏名、类型、语言、编号和更新日期。文件夹内整合以下内容:

  • 介绍文本
  • 更新日期
  • 介绍图和截图
  • 各分辨率版本(如触屏)
  • 评论

5. 文件预览

通过模拟器预览抓取的游戏文件,确保文件完整性和可用性。

注意事项

由于软件是基于模拟器运行的,请确保路径设置正确,以避免文件存取错误。

转载地址:http://ofwh.baihongyu.com/

你可能感兴趣的文章
oracle where 条件的执行顺序分析1
查看>>
oracle 中的 CONCAT,substring ,MINUS 用法
查看>>
Oracle 中的 decode
查看>>
oracle 中表一对多取多方的最新的一条数据
查看>>
oracle 使用 PL/SQL Developer创建表并插入单条、多条数据
查看>>
oracle 使用leading, use_nl, rownum调优
查看>>
oracle 修改字段类型方法
查看>>
Oracle 修改数据库表数据提交之后进行回滚
查看>>
UML-总结
查看>>
oracle 内存参数示意图
查看>>
Oracle 写存储过程的一个模板还有一些基本的知识点
查看>>
UML- 配置图(部署图)
查看>>
oracle 切割字符串加引号_使用Clean() 去掉由函数自动生成的字符串中的双引号...
查看>>
Oracle 创建 DBLink 的方法
查看>>
oracle 创建job
查看>>
oracle 创建一个用户,只能访问指定的对象
查看>>
oracle 创建双向备份,Materialized View 物化视图实现 Oracle 表双向同步
查看>>
oracle 创建字段自增长——两种实现方式汇总
查看>>
Oracle 升级10.2.0.5.4 OPatch 报错Patch 12419392 Optional component(s) missing 解决方法
查看>>
oracle 去重
查看>>