java实现有道翻译爬虫

我的博文地址

https://www.cnblogs.com/lingdurebing/p/11618902.html

使用的库

1.commons-codec

主要是为了加密,可以直接用java原生的,这里偷懒了,有点大才小用的感觉。

2.requests-5.0.7

大佬写的java 类似python的requests库

github地址:https://github.com/zhangjingpu/requests

和python的requests用法差不多。

3.fastjson

主要为了解析json字符串,没有要求。

4.实现

实现在上面博文里说的很详细,有道翻译的加密基本没改,唯一修改的就是字符串D: n%A-rKaT5fb[Gy?;N5@Tj

这里主要贴java代码

先引入需要的依赖。

python;gutter:true; net.dongliu requests 5.0.7</p> <pre><code> commons-codec commons-codec 1.13 com.alibaba fastjson 1.2.47 </code></pre> <pre><code> 然后是主要的实现类 ;gutter:true;
import java.io.IOException;
package com.yang.easySpider;

import java.io.IOException;
import java.io.InputStream;
import java.util.HashMap;
import java.util.Map;
import java.util.Properties;

import org.apache.commons.codec.digest.DigestUtils;
import net.dongliu.requests.Requests;

public class Fanyi {
private String msg;
private String url="http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule";
private String D="n%A-rKaT5fb[Gy?;N5@Tj";
private String bv;
private String salt;
private String sign;
private String ts;
private Map header;
private Map params;
public Fanyi()
{
params=new HashMap();
header=new HashMap();
}
private Map getParams(String msg)
{
params.put("i", setMsg(msg));//设置msg同时更新ts,salt,sign;
params.put("from","AUTO");
params.put("to","AUTO");
params.put("smartresult","dict");
params.put("client","fanyideskweb");
params.put("sign",this.sign);
params.put("bv",this.bv);
params.put("ts",this.ts);
params.put("salt",this.salt);
params.put("doctype","json");
params.put("version", "2.1");
params.put("keyfrom", "fanyi.web");
params.put("action", "FY_BY_REALTlME");
return params;
}
public String getResult(String msg)
{
return Requests.post(url).headers(getHeaders()).body(getParams(msg)).send().readToText();
//得到json格式的文本
}
public void setHeaders(Map header)
{
this.header=header;
}
public Map getHeaders()
{
if(this.header.get("Referer")==null)
{
this.header.put("Referer", "http://fanyi.youdao.com/");
}
return this.header;
}
public void setUserAgent(String UA)
{
this.header.put("User-Agent", UA);
//设置UserAgent
String cookie=Requests.get("http://fanyi.youdao.com").headers(this.header).send().getHeader("Set-Cookie").split(";")[0]+";";
//得到Cookie

//设置Cookie
this.header.put("Cookie", cookie);
this.bv=getBv(UA);//设置UA的同时要更新bv,因为bv是通过加密UA得到的。
}
private String getSalt()
{
this.salt=String.valueOf(this.ts)+String.valueOf(((int)Math.random()*10));
return this.salt;

}
private String getSign()
{
return getMd5("fanyideskweb"+this.msg+this.salt+this.D);
}
private String getTs()
{
return String.valueOf(System.currentTimeMillis());
}
private String getBv(String UserAgent)
{
return getMd5(UserAgent);
}
private String getMd5(String val)
{
return DigestUtils.md5Hex(val);
}
public String setMsg(String msg)
{

this.msg=msg;
//设置需要翻译的内容
this.ts=getTs();//更新ts
this.salt=getSalt();//更新salt
//设置翻译内容的同时更新ts,salt
this.sign=getSign();
//有了翻译内容,salt才能得到sign,网易主要靠此判断
return this.msg;
}
}

测试一下

java;gutter:true; public static void main( String[] args ) { Fanyi fanyi=new Fanyi(); fanyi.setUserAgent("Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.132 Safari/537.36"); String st=fanyi.getResult("hello"); System.out.print(st); JSONObject json=JSONObject.parseObject(st); JSONArray ja=(JSONArray) ((JSONArray) json.get("translateResult")).get(0); JSONObject js=(JSONObject) ja.get(0); System.out.print(js.get("tgt"));</p> <pre><code>} </code></pre> <p>

java实现有道翻译爬虫

Ok, 没有问题,完成。

参考博文连接地址:https://blog.csdn.net/suixinlun/article/details/93976400

Original: https://www.cnblogs.com/lingdurebing/p/ldrb-java-spider.html
Author: 零度热冰
Title: java实现有道翻译爬虫

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/599131/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • Python–Queue

    线程队列: 先入先出队列、后进先出队列、优先级队列 先入先出: 后进先出: 优先级队列: 设置队列空间大小 生产者消费者模型示例: Original: https://www.cn…

    数据库 2023年6月9日
    089
  • MySQL语句与正则表达式

    正则表达式的作用是匹配文本,将一个模式(正则表达式)与一个文本串进行比较。MySQL用WHERE子句对正则表达式提供了初步的支持,允许你指定正则表达式,过滤SELECT检索出的数据…

    数据库 2023年6月16日
    097
  • 【黄啊码】关于微信支付走过的坑

    错误:未定义数组索引:openid 。经过检查发现是 :微信支付授权获取 openId {“errcode”:40163,”errmsg&#82…

    数据库 2023年6月16日
    090
  • java读写锁

    工作遇到了金钱计算,需要用到读写锁保证数据安全。记录一下。 单纯读没有限制,读写、写写的时候会有安全问题。 _hashMap_存在并发线程安全问题,而 _hashtable_线程安…

    数据库 2023年6月16日
    080
  • 关于接口设计的思考–我们真的需要这么多入参吗

    最近,我改造一个旧接口时发现,这个接口有 30 多个入参,而事实上并不需要那么多,而且,这个接口还存在比较大的安全隐患。所以,关于如何设计接口入参,我想谈谈自己的一些想法。 当然,…

    数据库 2023年6月6日
    075
  • 一段文字

    https://book.douban.com/review/13674387/现代人的困境,其实从出生开始每个人都有强烈的感受。我们会按户口管理,强调身份的是各种标签,各种统计数…

    数据库 2023年6月11日
    077
  • 格林童话之祖父和孙子

    从前有个很老很老的老人,眼睛花,耳朵也背,双膝还不住地发抖。每当他坐在餐桌前 吃饭时,汤匙也握不稳,常常把菜汤撒在桌布上,汤还会从嘴边流出来。儿子和媳妇都嫌弃 他,老人只好躲到灶后…

    数据库 2023年6月9日
    090
  • tomcat上部署jenkins

    tomcat上部署jenkins tomcat上部署jenkins 部署tomcat 部署jenkins Jenkins创建流水线任务 主机名称 IP地址 需要的应用服务 工具包 …

    数据库 2023年6月14日
    082
  • SpringBoot 搭建基于 MinIO 的高性能存储服务

    1.什么是MinIO MinIO是根据GNU Affero通用公共许可证v3.0发布的高性能对象存储。它与Amazon S3云存储服务兼容。使用MinIO构建用于机器学习,分析和应…

    数据库 2023年6月14日
    0154
  • Java学习-第一部分-第三阶段-第四节:JDBC和数据库连接池

    JDBC和数据库连接池 笔记目录:(https://www.cnblogs.com/wenjie2000/p/16378441.html) 下载会使用到的包 JDBC概述 基本介绍…

    数据库 2023年6月11日
    0104
  • [LeetCode]3. 无重复字符的最长子串

    给定一个字符串,请你找出其中不含有重复字符的 最长子串 的长度。 示例 1: 输入: “abcabcbb”输出: 3解释: 因为无重复字符的最长子串是 &#…

    数据库 2023年6月9日
    067
  • 23种设计模式之状态模式和策略模式的区别

    文章目录 概述 状态模式 策略模式 区别 总结 概述 在行为类设计模式中,状态模式和策略模式是亲兄弟,两者非常相似,我们先看看两者的通用类图,把两者放在一起比较一下 ; 状态模式 …

    数据库 2023年6月6日
    0123
  • Mysql 数据恢复逻辑 基于binlog redolog undolog

    注:文中有个易混淆的地方”事务” sql事务,即每次数据库操作生成的事务,这个事务trx_id只在undolog里存储,因为MVVC需要记录修改的事务id,…

    数据库 2023年6月16日
    098
  • 升级JDK8的坎坷之路

    为更好的适应JAVA技术的发展,使用更先进及前沿的技术。所以推出将我们现在使用的JDK1.6(1.7)及tomcat6(7)升级至JDK1.8及tomcat8,使我们的系统获得更好…

    数据库 2023年6月6日
    094
  • MySQL explain结果Extra中”Using Index”与”Using where; Using index”区别探究

    问题背景 最近用explain命令分析查询sql执行计划,时而能看到Extra中显示为”Using index”或者”Using where; …

    数据库 2023年5月24日
    075
  • MySQL 日志管理

    日志文件记录 MySQL 数据库运行期间发生的变化,当数据库遭到意外的损害时,可以通过日志文件查询出错原因,并进件数据恢复 MySQL 日志文件可以分成以下几类: 二进制日志:记录…

    数据库 2023年5月24日
    059
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球