|
|
51CTO旗下网站
|
|
移动端

你比个手势,AI就识别出Emoji,浏览器上跑:已开源

一只手势识别AI,怎样才算得上 (优) 秀啊?不停地变换姿势,都能实时输出Emoji,大约是很秀了。

作者:圆栗子来源:量子位|2019-05-14 10:02

本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。

一只手势识别AI,怎样才算得上 (优) 秀啊?

不停地变换姿势,都能实时输出Emoji,大约是很秀了:

你比个手势,AI就识别出Emoji,浏览器上跑:已开源,推特2.8万赞

是守卫 (误) ,是来自《星际旅行》瓦肯的举手礼。不大常用,做起来甚至有难度。

是好运,一般会两只手一起比。不过,也不是人类通用的手势。

即便这样,AI依然机智地识别出来。并且,它是在浏览器上跑,也几乎没有延时

AI的爸爸,名字叫Nick Bourdakos (简称“尼克”) ,是来自IBM的程序猿。

尼克把自己的调教成果发了推特,揽下2.8万赞

你比个手势,AI就识别出Emoji,浏览器上跑:已开源,推特2.8万赞

△ 666

尼克用的是TensorFlow.js,实时识别毫无压力。

他把算法开源了,说大家都可以试一试。

半小时就好

尼克说这个模型很简单,就是SSD-MobileNet

MobileNet是分类,SSD是目标检测,搭配食用也是常规方法。

你比个手势,AI就识别出Emoji,浏览器上跑:已开源,推特2.8万赞

他是用IBM云上的GPU训练的,免费的k80,半小时就训练好了。

在训练开始之前,要先准备数据:AI吃的是标注过的手势图

准备就绪,就来安装模型吧:

  1. 1$ npm install -g cloud-annotations 

然后,可以开始训练了:

  1.  1$ cacli 
  2.  2┌─────────────────────────────┐ 
  3.  3│ (C)loud (A)nnotations (CLI) │ 
  4.  4│ version 1.0.12 │ 
  5.  5└─────────────────────────────┘ 
  6.  6 
  7.  7Usage: cacli <command> 
  8.  8 
  9.  9where <command> is one of: 
  10. 10 init Interactively create a config.yaml file 
  11. 11 train Start a training run 
  12. 12 logs Monitor the logs of a training run 
  13. 13 progress Monitor the progress of a training run 
  14. 14 list List all training runs 
  15. 15 download Download a trained model 
  16. 16 
  17. 17cacli <cmd> -h quick help on <cmd> 

当然,也不是非要用IBM云,也不是非要用GPU。拿CPU也能调教AI,大概要几小时吧。

训练完成,该在浏览器上跑了。GitHub项目里,自带了转换为TensorFlow.js模型的脚本。

把模型添加到React App里面。

你比个手势,AI就识别出Emoji,浏览器上跑:已开源,推特2.8万赞

最后,写一句nmp start,用浏览器打开http://localhost:3000。

耶,这样就可以对着屏幕随意舞动手指了,你的AI会明白的:

你比个手势,AI就识别出Emoji,浏览器上跑:已开源,推特2.8万赞

当然,这只机智的AI,才不是只能识别手指。

喝点什么

只看你用什么样的数据去投喂AI了。

曾经,尼克就帮AI修炼了分辨汽水的眼力。

第一题:一瓶雪碧,一瓶Canada Dry,都是绿色。

你比个手势,AI就识别出Emoji,浏览器上跑:已开源,推特2.8万赞

不管调换位置、还是侧过瓶身,AI都不会被迷惑。定格一看:

你比个手势,AI就识别出Emoji,浏览器上跑:已开源,推特2.8万赞

第二题:加大难度,两瓶都是Mountain Dew,一瓶普通一瓶低糖。

AI依然分得清楚,毫不犹豫。

你比个手势,AI就识别出Emoji,浏览器上跑:已开源,推特2.8万赞

分辨手势,分辨汽水,都不失水准。

那么问题来了,你想让AI识别什么呢?

想好了就开始调教吧,代码在这里:

https://github.com/cloud-annotations/training/

P.S. 推特评论区,已经有小伙伴亲测成功,并表示Easy。

你比个手势,AI就识别出Emoji,浏览器上跑:已开源,推特2.8万赞

△ 再把识别结果,显示成Emoji就完美了

【编辑推荐】

  1. 我是技术总监,你干嘛总问我技术细节?
  2. 腾讯的域名忘记续费,被阿里云拍了53.5万......
  3. 为什么说微软、谷歌、亚马逊等科技巨头殊途同归的终局是AIoT?
  4. 完全免费!GitHub发布软件包管理服务:NPM瑟瑟发抖
  5. 泄露数据显示:微软的移动战略正发挥作用
【责任编辑:张燕妮 TEL:(010)68476606】

点赞 0
分享:
大家都在看
猜你喜欢
24H热文
一周话题
本月最赞

订阅专栏+更多

我的运维日志系统构建之路

我的运维日志系统构建之路

数据驱动运维
共18章 | 我叫于小炳

194人订阅学习

CentOS文件服务的最佳实战

CentOS文件服务的最佳实战

涨薪跳槽必备技能
共15章 | 追风蚂蚁

90人订阅学习

小白网工宝典

小白网工宝典

一次搞定思科华为
共15章 | 思科小牛

503人订阅学习

读 书 +更多

XML基础教程

本书分为8章。第1章主要对XML做了简单的介绍。第2章详细讲解规范的XML文件。第3章主要讲解有效的XML文件,特别重点讲解DTD文件。第4章讲解C...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊

51CTO服务号

51CTO播客