转载申明:https://blog.csdn.net/m0_38080253/article/details/78838489
在python3的标准库中,已经移除了md5,而关于hash加密算法都放在hashlib这个标准库中,如SHA1、SHA224、SHA256、SHA384、SHA512和MD5算法等。
另:在网上找关于python的md5加密,发现要不是比较旧的不适用当前py版本的文章,或者是说得不够清楚的文章,所以还是自己去看下官方文档比较好,顺便整理下关于md5的使用方法。
对于学习任何一门程序类知识,我都认为去看官方文档这种学习方式最有效的之一,只不过一般这些文档都是英文版的,对于一些学习者来说可能会有一定门槛,但习惯于阅读英文文章,是非常重要的。
建议直接阅读python3的hashlib文档:? https://docs.python.org/3/library/hashlib.html?highlight=hashlib#credits
在hashlib库的hash算法中,提供了很多加密算法,有 sha1()、sha224()、sha256()、sha384()、sha512()、blake2b()和 blake2s()、md5(),这些方法都通过统一接口返回一个对象,例如,使用sha256()可以创建一个SHA-256的哈希对象。
当然,进行md5加密算法,就要用到md5()方法:
>>> import hashlib
>>> m = hashlib.md5()
>>> m.update(b'123')
>>> m.hexdigest()
'202cb962ac59075b964b07152d234b70'
>>> hashlib.md5(b'123').hexdigest()
'202cb962ac59075b964b07152d234b70'
>>> hashlib.new('md5',b'123').hexdigest()
'202cb962ac59075b964b07152d234b70'
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
以上是对于英文进行md5加密的,如果要对中文进行加密,发现按照上面来写会报错,原因在于字符转码问题,要如下写:
>>> import hashlib
>>> data = '你好'
>>> hashlib.md5(data.encode(encoding='UTF-8')).hexdigest()
'7eca689f0d3389d9dea66ae112e5cfd7'
此处先将数据转换成UTF-8格式的,使用网上工具对比下加密的结果,发现有的md5加密工具并不是使用UTF-8格式加密的。? 经测试目前发现可以转为UTF-8、GBK、GB2312、GB18030,不分大小写(因为GBK/GB2312/GB18030均是针对汉字的编码,所以md5加密后结果一样)。? 除了这些编码格式之外,还会有其他编码的,目前还没发现,等各位补充。? 看下面实例:
>>> hashlib.md5('你好'.encode(encoding='UTF-8')).hexdigest()
'7eca689f0d3389d9dea66ae112e5cfd7'
>>> hashlib.md5('你好'.encode(encoding='GBK')).hexdigest()
'b94ae3c6d892b29cf48d9bea819b27b9'
>>> hashlib.md5('你好'.encode(encoding='GB2312')).hexdigest()
'b94ae3c6d892b29cf48d9bea819b27b9'
>>> hashlib.md5('你好'.encode(encoding='GB18030')).hexdigest()
'b94ae3c6d892b29cf48d9bea819b27b9'
如果你仅仅查md5的写法,看上面实例就够了;? 如果你是python新手,想了解这些方法的意思和用法,继续看下面内容。
解析
1. hashlib.new(name[,data])方法
这是个一般性方法。? name传入的是哈希加密算法的名称,如md5;? data传入的是需要加密的数据,可忽略,在之后update()中传入。
>>> m = hashlib.new('md5')
>>> m.update(b'123456')
>>> m.hexdigest()
'202cb962ac59075b964b07152d234b70'
可以使用hashlib.algorithms_guaranteed 或者hashlib.algorithms_available 这两个内置属性查看hashlib支持哪些加密算法。
hashlib.algorithms_guaranteed 是在所有平台上,保证被hashlib模块支持的hash算法名称的集合;?
hashlib.algorithms_available 是在当前运行的python编译器可用的hash算法名称的集合,由于OpenSSL的原因,在这当中可能会出现重复的hash算法名称。?
hashlib.algorithms_guaranteed 是hashlib.algorithms_available 的子集。? 看下面输出:
>>> hashlib.algorithms_guaranteed
{'sha3_384','md5','blake2s','sha3_512','blake2b','shake_128','sha384','sha3_256','sha1','shake_256','sha3_224','sha512','sha256','sha224'}
>>> hashlib.algorithms_available
{'whirlpool','ripemd160','dSAEncryption','SHA224','SHA512','SHA256','SHA384','sha','sha224','RIPEMD160','SHA','MD5','DSA','sha3_384','DSA-SHA','ecdsa-with-SHA1','SHA1','dsaWithSHA','md4','MD4','sha3_224'}
2. hash.update(arg)
传入arg对象来更新hash的对象。必须注意的是,该方法只接受byte类型,否则会报错。这就是要在参数前添加b ?来转换类型的原因:
>>> m = hashlib.md5()
>>> m.update('123456')
TypeError: Unicode-objects must be encoded before hashing
同时要注意,重复调用update(arg)方法,是会将传入的arg参数进行拼接,而不是覆盖。必须注意这一点,因为你在不熟悉update()原理的时候,你很可能就会被它坑了。? 也就是说,m.update(a); m.update(b) ?等价于m.update(a+b) ,看下面例子:
>>> m = hashlib.md5()
>>> m.update(b'123')
>>> m.hexdigest()
'202cb962ac59075b964b07152d234b70'
>>> m.update(b'456')
>>> m.hexdigest()
'e10adc3949ba59abbe56e057f20f883e'
>>> hashlib.md5(b'123456').hexdigest()
'e10adc3949ba59abbe56e057f20f883e'
3. hash.hexdigest()
都知道,在英语中hex有十六进制的意思,因此该方法是将hash中的数据转换成数据,其中只包含十六进制的数字。另外还有hash.digest()方法。
(编辑:北几岛)
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!
|