抓取晋江文学城小说乱码问题

今天在抓取晋江文学城小说时,不管是用curl还是采用本身的file_get_content都会出现乱码问题,这个乱码问题并不是编码问题,使用java脚本测试是好的,经过各种折腾都没有找到问题。

最后我用httpanalyzer抓包的时候,居然奇迹般的好了,关闭抓包又不行了。最后发现是编码问题,转一下编码就可以了。

从比特彗星的种子库获取种子hash到key的php实现

特彗星的种子形如

http://torrent-cache.bitcomet.org:36869/get_torrent?info_hash=004f50950256e66f128d528d0773fdefbc298cce&size=226920869&key=44a2a41842ff15b47cf54c1470356b32cba26730

其中key的算法是重点,通过反编译某人的com组件然后使用php实现了该算法

$hex = hex2bin($hash);
$key = sha1('bc'.$hex.'torrent');