|
|
|
|
公众号矩阵

Github高赞:给文字打马赛克=形同虚设,AI看透你一切小心思,已开源

Depix 的主要功能,就是利用 AI 算法,将被像素化的文本内容从马赛克中还原出来。其适用于用线性盒过滤器创建的像素化图像。

作者:新智元来源:新智元|2020-12-18 10:04

“来P个图吧!” “好呀,不过这段话得打码,不然就麻烦了!”

如果现在告诉你,”打码“已经不再安全,你所想保护的信息,已然如”皇帝的新衣“,你会作何想?

不,这不是耸人听闻,最近一个名为 Depix 的 GitHub 项目火了,上线仅仅三天,star 量就已经高达 7K。截止发文,此项目已经火速达到 1w+ 的 star 量:

而就是这项技术,能够解码被打上马赛克的文字,你的所有努力,甚至有了”欲盖弥彰“的效果。

手机涂鸦如同“徒劳”,外行也能轻易恢复隐藏信息

前段时间,网络上爆出,使用手机涂鸦对图片所进行的操作,其实可以轻易被恢复:

简单拿微信聊天截屏的文字涂鸦来说:

我们身边太多的人,都可能会用这种涂鸦技术,遮盖自己想保密的信息。

看似很安全,对不对?

其实在有心人看来,你的操作可以马上成为徒劳:

只需要再次利用手机的图片编辑功能,将曝光、鲜明度、高光、阴影、亮度等参数全部调至 +100,然后再将对比度参数调至-100,然后,神奇的事情发生了:

行家都知道,相比于涂鸦,马赛克却无法被修复和逆转,令人非常的安心。

可是,放在现在,在 AI 面前,修复厚码图片中隐藏的内容,也成为了可能:

Depix——修复厚码文字内容,现已开源

Depix 的主要功能,就是利用 AI 算法,将被像素化的文本内容从马赛克中还原出来。其适用于用线性盒过滤器创建的像素化图像。

其目的不是去马赛克,而是做文字恢复使用。虽说这可能令一些宅男失望,但其作用依旧强大且有意义。

此项目是由信息安全顾问 Sipke Mellema 开发的,目前仅支持英文字母、数字和英文标点符号。

而任何此个开源项目的使用者,简简单单使用以下指令,就可以恢复你想“窥探”的文字内容:

python depix.py -p images/testimages/testimage3_pixels.png -s images/searchimages/debruinseq_notepad_Windows10_closeAndSpaced.png -o output.png

完整操作如下:

从截图中剪出像素化的方块,作为一个矩形。

将 De Bruijn 序列粘贴到编辑器中,使用相同的字体设置(文本大小、字体、颜色、hsl)。

制作序列的截屏。如果可能的话,使用同样的截图工具来创建像素化的图像。

运行 run python depix.py -p [pixelated rectangle image] -s [search sequence image] -o output.png

算法原理简单:分割小块,德布鲁因序列字符库助力像素匹配

Depix 的原理是将马赛克区域的内容分割成许多个小块,然后将每个小块都和预先设置好的字符库(德布鲁因序列(De Bruijn sequence))进行像素匹配。

具体算法流程如下:

该算法利用了线性盒滤波器,来分别处理每个块的特性。对于每个块,它对搜索图像中的所有块进行像素化,以检查是否直接匹配。

对于大多数像素化的图像,Depix 设法找到单一匹配的结果。它假设这些都是正确的。然后,将周围的多匹配块的匹配在几何上与像素化图像中的相同距离进行比较。匹配也被视为正确。这个过程要重复几次。

当正确的块没有几何匹配时,它将直接输出所有正确的块。对于多匹配块,它输出所有匹配的平均值。

开发这个 AI 项目,Mellema 并不是为了窃取信息,而是利用 ECB 和明文攻击的模式,提高信息保护技术。

在他看来,不知道如何破坏当前的保护模式,是信息安全中的常见陷阱。

Depix 主要是针对打码文字的处理,而说到修复马赛克像素级别图片的技术,我们不得不提杜克大学的 AI 算法 PULSE:

宅男福利?渣画质修复还要看杜克 PULSE

杜克大学的 AI 算法 PULSE(Photo Upsampling via Latent Space Exploration),可以将像素渣到马赛克级别的图片修复:

该算法可以将模糊、无法识别的人脸图像转换成计算机生成的图像,并且具有比之前任何时候都更加精细、逼真的细节。

按照之前的方法,想要把一张模糊的大头照变清晰,最多只能将这张照片缩放到原始分辨率的八倍。

而 PULSE,可以仅在几秒钟内,就可以把 16x16 像素的低分辨率小图,放大 64 倍,变成 1024 x 1024 像素的高分辨率图像。

这种将像素放大 64 倍级别的,绝对是业界首次。

原本低分辨率照片中无法看到的细节,比如毛孔、细纹、睫毛、头发和胡茬等,经过 PULSE 算法处理后,都能看得一清二楚:

涉及到实际应用方向上,论文的共同作者 SachitMenon 介绍称:

「在这些研究中,我们只是用面部作为概念验证。

但从理论上讲,该技术是通用的,从医学、显微镜学到天文学和卫星图像,都可以通过该技术改善画质。」

与此类似的,还有谷歌的超强像素递归方案,感兴趣的朋友可以自行探索。

最后附上 Depix,PULSE 的项目链接:

Depix 项目地址:https://github.com/beurtschipper/Depix

PULSE 项目地址:https://github.com/adamian98/pulse

【编辑推荐】

  1. 牛批!一张6000w数据表的查询优化到0.023s
  2. 使用Wireshark对网络通信扑捉,进行三次握手和四次挥手原理分析
  3. Google内讧升级!员工签署联名信:AI大神Jeff Dean必须道歉!
  4. 开源!一文了解阿里一站式图计算平台GraphScope
  5. GitHub宣布全站清理不必要的Cookie提示栏
【责任编辑:张燕妮 TEL:(010)68476606】

点赞 0
分享:
大家都在看
猜你喜欢
24H热文
一周话题
本月获赞

订阅专栏+更多

数据湖与数据仓库的分析实践攻略

数据湖与数据仓库的分析实践攻略

助力现代化数据管理:数据湖与数据仓库的分析实践攻略
共3章 | 创世达人

1人订阅学习

云原生架构实践

云原生架构实践

新技术引领移动互联网进入急速赛道
共3章 | KaliArch

30人订阅学习

数据中心和VPDN网络建设案例

数据中心和VPDN网络建设案例

漫画+案例
共20章 | 捷哥CCIE

196人订阅学习

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊

51CTO服务号

51CTO官微