前言

好几年前就开始接触 dht 了，那时还是 小虾 引起的潮流.
大概原理基本都了解了, 就是代码写的难看，执行效率也不高。
这几年有很多人也接触到这些，开源了不少简洁而又高效的代码。

技术表

我用的是 python3, 不是主流，所以要自己写编码和解码，有了 bencoding。

bencode, 它只支持 python2.

bencoder.pyx, A fast bencode implementation in Cython.

bootstrap-dht, 它简单的示例了下 dht 启动服务器。

simDHT, 它是老太太的杰作, 简单又简洁。
它最先解决了怎么才能高效的认识其他节点，也就是改变发送的 id。id 的高位也就是最前面的影响最大，距离越远。
maga, 这是最近发现的，它使用了 asyncio, 非常高效，代码也
很简洁，推荐看一下。

这种方法不会受限于人，它根据bittorrent协议去下载信息。优点是全，稳, 缺点就是慢.
如果直接根据 announce_peer 去下载，有很多 peer 连不上，有很多 peer 自己都还没下载完成。

这种方法就是去抓像迅雷这样的提供者.优点是快，缺点是不全，要看它们的脸色.

ip 4 个字节，怎么转成 ‘192.168.1.1’ 这样，用 socket.inet_ntoa,半路出家的坑啊。

写爬虫完全不需要

像 maga 那样，效率太高了，cpu 和网络占用太多。给它定个限制，一分钟只能发多少个包，
超过的直接就不发了，因为是爬虫，丢包没影响。

绝大多数可以用 utf8 解码，出错在用 gb18030, 剩下的就难搞了，只能丢掉了。