Jack Cui https://cuijiahua.com 分享技术 乐享生活 Tue, 17 Sep 2019 01:24:27 +0000 zh-CN hourly 1 https://wordpress.org/?v=5.1.2 程序员欢乐送(第34期) https://cuijiahua.com/blog/2019/09/life-42.html https://cuijiahua.com/blog/2019/09/life-42.html#comments Fri, 06 Sep 2019 01:00:06 +0000 https://cuijiahua.com/?p=6543 程序员欢乐送(第34期)

对于我来说,一直保持的追求有三点:技术、快乐、财富。因此,从此三点出发,记录过去一周,我所看到的,值得分享的内容,每周五把欢乐送达。

技术

1、CraftAssist

CraftAssist 是 Facebook开源的 AI 助手的平台,可以在沙盒构造游戏 Minecraft 中与人类玩家协作。

助手可以移动,放置或摧毁积木,并产生暴徒;并可以通过基于文本的聊天与人类玩家进行交流。通过在游戏中结合语言,感知,记忆和物理行为,这些机器人可以执行复杂的任务,例如建造房屋。

程序员欢乐送(第34期)

发展这些技能可以帮助研究人员更接近更广泛的人工智能合作。该平台旨在支持对与人类参与者指定和评估的各种任务进行交互并且有用的智能体研究。

项目地址:点击查看

2、ImageAI

ImageAI是一个python库,旨在使开发人员能够使用简单的几行代码构建具有包含深度学习和计算机视觉功能的应用程序和系统。

ImageAI本着简洁的原则,支持最先进的机器学习算法,用于图像预测,自定义图像预测,物体检测,视频检测,视频对象跟踪和图像预测训练。

想入手深度学习的朋友,可以看看。

程序员欢乐送(第34期)

项目地址:点击查看

3、OpenSpiel

众所周知,强化学习(Reinforcement Learning)是一种人工智能训练技术,无论是在棋牌游戏方面打败人类选手的机器人,还是在训练自动驾驶系统方面,强化学习都起着至关重要的作用。

DeepMind 研究团队发布了一个称为 OpenSpiel 的游戏面向增强学习框架,提供了增强学习需要的环境以及算法,可用于一般增强学习、搜索以及规划的研究,并提供了分析增强学习动态的工具,以及常用的评估指标。

Spiel意指桌面游戏。因此,OpenSpiel中的环境就是相关棋牌类游戏,覆盖28款游戏,24个算法。

程序员欢乐送(第34期)

项目地址:点击查看

4、PyEcharts

PyEcharts 是一个Python的数据可视化工具,基于百度开源的 Echarts 的二次开发。凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。

PyEcharts 可视化的数据图有很多种,例如2D常规的柱状图、箱线图、折线图、K线图、热力图、动态散点图等,也有3D常规的柱状图、散点图、折线图等。此外,也支持地图、雷达图、仪表盘、水球图等多种非常规可视化方式。

程序员欢乐送(第34期)

程序员欢乐送(第34期)

有可视化需求的朋友,可以看下。

项目地址:点击查看

5、adaptive-span

adaptive-span 是一种新的自注意力机制算法,算法提出了一个替代自我注意层,以减少变压器的计算负担的方法。

在使用 Transformer 的时候,能够显著扩展上下文的跨度,同时保持对其内存占用和计算时间的控制。

在字符级语言建模任务上,验证了本文方法的有效性,通过使用最大 8k 字符上下文,在 text8 和 enwiki8 数据集上实现了不错的效果。

程序员欢乐送(第34期)

项目地址:点击查看

6、Facial Details Synthesis

Facial Details Synthesis 是一个基于单幅图像的真实人脸细节合成算法,通过单张图像就可以合成 3D 人脸。

该方法利用表情分析技术生成人脸几何轮廓,并结合有监督和无监督学习补充人脸细节纹理。通过实验证明,该方法可以生成质量较高的 3D 人脸。

程序员欢乐送(第34期)

项目地址:点击查看

7、CkipTagger

在做NLP相关工作的时候,经常需要用到“切词”工具,例如大名鼎鼎的jieba。

CkipTagger 是由中科院开源的国产“切词”工具,不仅支持简体字切词,也支持繁体字。在多达5W句的 ASBC 4.0 汉语语料库测试集上,CkipTagger的切词准确率要高于jieba。

程序员欢乐送(第34期)

感兴趣的朋友,可以看下。

项目地址:点击查看

快乐

1、被绿的惨不忍睹

程序员欢乐送(第34期)

程序员欢乐送(第34期)

2、当老师实在太难了!

程序员欢乐送(第34期)

财富

最近,在北京一个很强烈的感受就是猪肉和水果价格一直在涨,刚过完年那阵,做一顿东北菜猪肉炖豆角,成本也就20元左右,而现在成本已经涨到了30多。

水果价格相对还好一些,毕竟种类多样,可以挑自己“吃得起”的去买。肉类,种类不多,还都挺贵,对于“肉食动物”的我,猪肉算是“刚需”了。

养猪上市的龙头公司牧原股份2019年初就开始大涨,一直涨到现在,是不是可以买点牧原股份对抗下猪肉上涨?

程序员欢乐送(第34期)

A股最近也景气一些了,主要体现在股市不再噤若寒蝉,无视各种利空消息,走势强劲。其实,判断股市是否有上涨潜力,不是看有多少利好消息,而是看遇到一次又一次的利空打击后,股价是否能够顽强抵抗。

定投了快半年的500ETF,终于“见红”了,刚开始定投,正好抄在了“山峰”,一直处于亏损状态,由于不断的补仓,拉低成本,以及股市的回暖,收益刚刚翻红。

程序员欢乐送(第34期)

又快到每月15号的定投日了,如果股市继续保持强劲涨势,这次会根据情况少定投一点。

最后

本周的程序员欢乐送,到此结束,下周再会。

]]>
https://cuijiahua.com/blog/2019/09/life-42.html/feed/ 8
程序员欢乐送(第33期) https://cuijiahua.com/blog/2019/08/life-41.html https://cuijiahua.com/blog/2019/08/life-41.html#comments Fri, 30 Aug 2019 01:00:29 +0000 https://cuijiahua.com/?p=6519 程序员欢乐送(第33期)

对于我来说,一直保持的追求有三点:技术、快乐、财富。因此,从此三点出发,记录过去一周,我所看到的,值得分享的内容,每周五把欢乐送达。

技术

1、SickZil-Machine

SickZil-Machine是漫画汉化组的福音,它是一款可以去掉漫画中的文字,并进行背景修复的工具。

漫画汉化组除了翻译的工作,还需要对漫画的文字进行抹去,这样巨大的工作量,交给算法完成,简单方便。

程序员欢乐送(第33期)

SickZil-Machine是由一群韩国小伙伴开发的,现已开源。

整个过程,一共分为两步:文字分割和背景修复。

  • SegNet网络负责把需要抹掉的文字部分,分割出来;(借鉴U-Net)
  • ComplNet网络负责把抹掉之后露出的背景补全。(借鉴DeepFillv2)

项目地址:项目地址

2、VoteNet

VoteNet是一个3D目标检测新框架,由FAIR(Facebook AI实验室)和斯坦福大学等人联合发布。

该算法直接处理原始数据,不依赖任何2D检测器。该模型设计简单,模型紧凑,效率高,在两大真实3D扫描数据集上实现了最先进的3D检测精度。

该网络学习直接从点云向目标质心投票,并学会通过它们的特性和局部几何信息来聚合投票,以生成高质量的object proposals。

程序员欢乐送(第33期)

项目地址:点击查看

3、GPT2-Chinese

GPT-2,逆天的语言AI模型,编故事以假乱真,问答翻译写摘要都行。

问世之后横扫各大语言建模任务,引发了大量关注以及研究者跟进研究,但在中文语境中的应用非常少,因为没有人基于中文语料去大规模复现。

现在,有人这样完成了这个工作。一位于南京开发者,在GitHub上开源了的GPT-2 Chinese。

支持BERT的Tokenizer或GPT2自带的BPE Tokenizer或Sentencepiece的BPE model,写诗,新闻,小说,或是训练通用语言模型。支持字为单位或是分词模式或是BPE模式,支持大语料训练。

例如,使用算法生成七言绝句。

程序员欢乐送(第33期)

项目地址:点击查看

4、RepPoints

RepPoints的作者来自微软和清华,该算法的一个创新点是 deformable 卷积的巧妙应用。

目前检测中通常是用一个矩形框来表征目标,优势是做法简单(只需回归左上和右下两个点就能确定目标),但是这种表示是粗糙的,比如在两阶段方法中提取的 proposal 的特征包含很多的背景特征。

该论文提出了一种新的方法,不需要额外的标注(groundtruth还是目标框),用 n 个点来表征目标框,从而取得了更好的性能。

程序员欢乐送(第33期)

项目地址:点击查看

5、InstaBoost

近年来最新的一系列实例分割模型,例如 Mask R-CNN 等,其高准确度很大程度上依赖于大量的训练数据。但是获取像素级别的标注是一项成本高昂且复杂精细的工作。

为此,上海交通大学 MVIG 实验室(卢策吾团队)提出了 InstaBoost,它是一种基于 crop-paste 的实例分割数据增强方法。

实验表明,在 Mask R-CNN 和 Cascade R-CNN 等框架中应用 InstaBoost,可以在 COCO 实例分割数据集上达到 2.2 mAP 的提升。

同时,该方法还能够将物体检测的精度在 COCO 数据集上最高提升 4mAP。

程序员欢乐送(第33期)

项目地址:点击查看

6、GSCNN

GSCNN 是一个新的语义分割算法。以往的语义分割 CNN 都整幅图信息作为输入,颜色信息、纹理信息、轮廓信息等都是柔和在一起。

而 GSCNN 提出了一种双信息流的 CNN 架构,一个负责处理原始图片,一个单独处理边缘信息。

这种架构的关键在于新的 gates 结构,不同于已有的 concat 这种简单的通道融合。实验表明,这种结构更高效,对于物体边界和小目标有更好的分割效果。

程序员欢乐送(第33期)

项目地址:点击查看

7、MediaPipe

MediaPipe 是谷歌开源的手势识别算法,借助Tensorflow Lite可以在手机上实时运行。

程序员欢乐送(第33期)

谷歌已经把这款手势识别器做成了一款名为“Hand Tracking GPU”的App,在安卓端有对应的apk安装包,下载到手机上,安装成功后,无需联网就可以直接用了。

当然,iOS用户也可以安装,但是没有现成的安装包,可以下载源代码自行编译。

感兴趣的朋友,可以看一下。

项目地址:点击查看

快乐

1、三句话总结各个app

程序员欢乐送(第33期)

2、小朋友对称感很强

程序员欢乐送(第33期)

程序员欢乐送(第33期)

程序员欢乐送(第33期)

程序员欢乐送(第33期)

财富

中国A股还是很有特点的,整体来看,呈持续上涨的趋势。

以上证指数为例,在近30年的时间里,虽然涨涨跌跌,但是总体上是上涨的。

程序员欢乐送(第33期)

而且涨幅还不低,过去30年的时间里,如果简单算下每年的平均涨跌幅,你会发现,平均涨幅高达22.848%。

当然,这归功于中国改革开放30年带来的经济增长,概括的说,中国股市的投资,长期看经济,中期看政策,短期看资金。

此外,A股的另一个特点就是牛短熊长

在过去的20多年里,A股经历过2次超级牛市,一次是在2007年,一次是在2014年。

2007年之前的6年多的时间里,股市长期震荡。同样,在2014年前,也有长达5年的震荡的时期。

中国股市呈周期性,且牛市来得快,去得也快,也就是牛短熊长。

程序员欢乐送(第33期)

在A股这种牛短熊长的情况下,投资最简单有效的策略有两个:

  • 买入股票型基金并长期持有,坐等到一波行情的来临;
  • 坚持定投,不断积累筹码,挺到一波牛市到来,也会有非常可观的收益。

对于普通投资者来说,很难去判断准确未来会是大盘涨得好还是小盘涨得好。

根据A股的特点,一个好的投资方式就是早入场,坚持长期投资,不仅要做到资金上的长期,更要有心态上的长期性,并且要采取分散配置的策略。

最近,股市小涨了几波,之前跌了近2000,现在也涨回了不少。

程序员欢乐送(第33期)

当然,股市现在仍处于震荡期,但不会像之前那样,川普发个twitter,中国股市都跟着跌一跌,目前来看股市受贸易战影响减少了很多。

最后

本周的程序员欢乐送,到此结束,下周再会。

]]>
https://cuijiahua.com/blog/2019/08/life-41.html/feed/ 5
程序员欢乐送(第32期) https://cuijiahua.com/blog/2019/08/life-40.html https://cuijiahua.com/blog/2019/08/life-40.html#comments Fri, 16 Aug 2019 00:59:09 +0000 https://cuijiahua.com/?p=6466 程序员欢乐送(第32期)

对于我来说,一直保持的追求有三点:技术、快乐、财富。因此,从此三点出发,记录过去一周,我所看到的,值得分享的内容,每周五把欢乐送达。

技术

1、Snip

曾在《程序员欢乐送(第17期)》中推荐过Snip,当时该工具只支持PC端的使用,现在移动手机端的App也发布了。

再简单介绍下Snip的功能:免费帮你快速把数学公式照片转成LaTeX代码,支持安卓和iOS。

程序员欢乐送(第32期)

操作起来依旧非常简单。

官方网站:点击查看

2、Cancer Diagnosis

2018年全球有1810万癌症新发病例和960万癌症死亡病例,癌症一直是人类健康的“顶级杀手”。

谷歌近期完成了一项潜力无限的研究,使用深度学习算法结合显微镜硬件的方法,制作了一个台智能显微镜,该显微镜能从海量细胞中自动寻找癌细胞病灶,完成实时检测

凭借着这项研究,该文章登上了Nature Medicine。

相比从前天荒地老的显微镜下地毯式搜查,AI算法能瞬间抓捕癌细胞,堪比生物界的安防摄像头

为了提高速度,研究团队将完全卷积网络(FCN)应用到了InceptionV3深度学习构架中,组成了InceptionV3-FCN,减少了75%的计算量。从而达到检测本地化,以及实时检测的效果。

程序员欢乐送(第32期)

Nature地址:点击查看

3、MedicalNet

MedicalNet 是一个 3D 医疗影像预训练模型,是由腾讯优图团队对外开源的首个医疗 AI 项目。其将多个 3D 医疗数据集集合成大数据集,基于此数据集提供了完整的 3D-ResNet 系列预训练模型与相应的迁移学习训练代码。

MedicalNet 提供的预训练网络可迁移到任何 3D 医疗影像的 AI 应用中,包括但不限于分割、检测与分类等任务,尤其适用小数据医疗影像 AI 场景,能加快网络收敛,提升网络性能;通过简单配置少量接口参数值,即可进行微调训练;提供多卡训练以及测试评估代码,接口丰富,扩展性强;提供不同深度 3D ResNet 预训练模型,可供不同数据量级应用使用。

程序员欢乐送(第32期)

项目地址:点击查看

4、GraphVite

图是一种通用、灵活的数据结构,可以用来编码不同对象之间的关系,并且在现实世界中非常普遍,如社交网络、引文图、蛋白质相互作用图、知识图谱等,涵盖了多个应用和领域。

然而,这是一个颇具挑战性的问题,因为现实世界中的图可能非常庞大,并且是异质的。因此,业界和学界的不同任务和应用都迫切需要可扩展的通用图表征系统。

为此,加拿大 Mila 研究所唐建课题组的研究人员开发了一个通用、高性能的图嵌入系统:GraphVite,该系统训练百万级别的节点嵌入只需 1 分钟左右,比现有实现快 50 倍以上,此外,该系统最大可处理二十亿边的图,是目前速度最快、规模最大的单机图嵌入系统。

程序员欢乐送(第32期)

项目地址:点击查看

5、GitHub Actions

Github Actions是Github推出的一个新的功能,可以为我们的项目自动化地构建工作流,例如代码检查,自动化打包,测试,发布版本等等。

想象一下这样一种场景,你写好了一个网站的代码,并且存储到了 Github 上,但完事了吗?没有,你还需要部署代码才能让别人访问你的网站。另外,如果你修改了代码,还需要单独测试。理想的情况是:当你将代码提交到 master 时,测试、部署等等所有工作自动执行。

Github Actions 可以自动化和定制化项目的 Workflow,像官网显示的那样。

程序员欢乐送(第32期)

项目地址:点击查看

6、PyCM

在训练分类模型的时候,经常需要看混淆矩阵。PyCM 就是一个用 Python 编写的多类混淆矩阵库,支持输入数据向量和矩阵,是支持大多数类和统计参数的模型评估工具。

程序员欢乐送(第32期)

感兴趣的朋友可以看下。

项目地址:点击查看

7、torch2trt

TensorRT是一个很好的模型加速引擎,线上业务很多采用TensorRT作为加速解决方案。

现实开发中,线上业务支持的是TensorRT,线下开发使用的是Pytorch。这时,我们就需要一个Pytorch转TensorRT的工具。

torch2trt就是这样一款Python API,满足我们一般的模型转换需求。

程序员欢乐送(第32期)

项目地址:点击查看

快乐

1、你为什么不谈恋爱?

2、孩子掌握了全家的自拍姿势

财富

今天说说“风险等级”,我们需要根据自己可承受的风险等级配置自己的资产。

基本上银行都会根据综合风险把自己的理财产品划分为5个等级。比如招商银行分为:

  • 谨慎型产品(R1)
  • 稳健型产品(R2)
  • 平衡型产品(R3)
  • 进取型产品(R4)
  • 激进型产品(R5)

不用平台对风险的描述略有不同,但是一般都是划分为五个等级,可能名字略有不同。

程序员欢乐送(第32期)

从产品类型角度来说,保本保收益的基本上是R1、保本浮动收益的为R2。

一般大家能买到的固定收益产品,基本都是R1低风险、R2中低风险。

在买理财产品之前,我们在购买的理财产品app上,完成一次风险评估。

评估结果决定了我们能够购买什么理财产品。

例如,风险评估的结果为R2,那就无法购买R3风险以上的理财产品,例如股票等。

当然,可以风险评估是可以进行很多次的,对结果不满意的可以反复尝试。不过,还是建议“从心”的选择。

简单描述就是,你购买的这款理财产品实际上购买了一款信托产品,其风险级别等同于信托的风险级别。

想进行一个风险评估测试,可以下载一个招商银行App,搜索风险评估,即可进行测试。

最后

本周的程序员欢乐送,到此结束,下周再会。

]]>
https://cuijiahua.com/blog/2019/08/life-40.html/feed/ 3
程序员欢乐送(第31期) https://cuijiahua.com/blog/2019/08/life-39.html https://cuijiahua.com/blog/2019/08/life-39.html#comments Fri, 09 Aug 2019 01:04:29 +0000 https://cuijiahua.com/?p=6425 程序员欢乐送(第31期)

对于我来说,一直保持的追求有三点:技术、快乐、财富。因此,从此三点出发,记录过去一周,我所看到的,值得分享的内容,每周五把欢乐送达。

技术

1、UGATIT

小时候,玩游戏,创建角色的时候,会想选个酷酷的头像作为游戏用户头像。再长大点,又想选一个自己的真人漫画版头像,作头像。

可惜,当时没有一个很好的技术帮我实现这个想法。近期,一个韩国游戏公司NCSOFT发表的最新研究成果,对有类似想法的朋友,或许会有所帮助。

改算法可以将女生自拍照,自动转换为二次元风格图片。

程序员欢乐送(第31期)

这个算法叫U-GAT-IT,它是用无监督方法训练的,连成对的数据都不需要。

团队已经把TensorFlow实现和PyTorch实现,都放上了GitHub。

项目地址(Pytorch):点击查看

项目地址(Tensorflow):点击查看

2、Chudo

Chudo是一款基于深度学习的通信App,用这个App可以聊天,发照片或视频等。

与一些我们熟知的聊天工具不同的地方是,Chudo可以让每个用户拥有自己的个性化卡通人物形象,可以使用这个卡通人物与他人交流。

程序员欢乐送(第31期)

这款App可以实时处理视频,帧率可达 60 FPS。

官网地址:点击查看

3、style2paints

style2paints已经开源了几个版本,目前最先版本是V4版,style2paints是目前最好的AI线稿上色工具之一。

style2paints不像从前那些端到端的图到图翻译算法,它是第一个按照真实生活中、人类的工作流来着色的方法。

它得出的结果,也像人类作画一样是分层的。

从线稿开始,到右上角平面的颜色 (Flat Color) ,再到左下角有梯度的颜色 (Color with Gradient) ,最后到右下角加上阴影的结果 (Shaded Result) 。

程序员欢乐送(第31期)

除了自动生成,也支持半自动的方式,对于不满意的地方可以手动修改,操作也很简单。

项目地址:点击查看

4、DELTA

在意大利佛罗伦萨召开的ACL2019大会上,滴滴正式宣布开源基于深度学习的端到端的自然语言处理和语音处理平台DELTA。

旨在进一步帮助 AI 开发者创建、部署自然语言处理和语音模型,构建高效的解决方案,助力 NLP 应用更好落地。

DELTA 主要基于 TensorFlow 构建,能同时支持 NLP(自然语言处理)和语音任务及数值型特征的训练,整合了包括文本分类、命名实体识别、自然语言推理、问答、序列到序列文本生成、语音识别、说话人验证、语音情感识别等重要算法模型,形成一致的代码组织架构,整体包装统一接口。

程序员欢乐送(第31期)

项目地址:点击查看

5、Handout

Handout是一个Python工具,全名叫Python Handout。它可以方便的让使用者,将自己的Python代码转换为Markdown的格式文本。此外,还可以直接运行出Python代码的结果,相当于一个没有hidden state的Jupyter笔记本。

程序员欢乐送(第31期)

感兴趣的朋友可以试一下。

项目地址:点击查看

6、FSS-1000

FSS-1000是一个分割数据集,包含了1000个类别,一共提供了10000张图片,可以用于分类、检测、分割任务。

这个数据集中主要包括的目标是VOC、ImageNet和COCO等数据集没标注过的生活常见物品,例如日常用品、商品、徽标等。

同时,该数据集对每幅图标注目标的数量进行了限制,最多只有5个目标。

程序员欢乐送(第31期)

项目地址:点击查看

7、CelebAMask-HQ

CelebAMask-HQ也是近期发布的数据集,为了为人脸语义分割和属性操作打下更好的研究基础,研究人员在CelebA-HQ的基础上构建了包含30000张高分辨率512×512的人脸图片,包含了面部19类详细的信息标注。

针对被部分遮挡的面部区域,标注员还进行了推断补全了语义标签。与先前的Helen 数据集相比,图像的数量扩大十多倍,同时标签的数量了也增加了近两倍。

程序员欢乐送(第31期)

项目地址:点击查看

快乐

1、这个设计有点喜欢了

程序员欢乐送(第31期)

程序员欢乐送(第31期)

2、从小就吃透了女人的苦

程序员欢乐送(第31期)

程序员欢乐送(第31期)

财富

简单说说最近股市吧,也不能只报喜,不报忧。

上周五,也就是我国的8月2日,川普关税大刀再次挥向大陆,声称将于9月1日开始对3000亿美元中国输出商品加征10%的关税,受此影响,美股3大指数跌至1月低点,标普500与纳达斯指数创下2018年12月以来最大周线跌幅。

同样,A股在本周周一,开盘大跌,全天低位徘徊。

随后,人民币美元汇率离案和在案价格均突破“7”这一整数关口,这也是人民币兑美元汇率近十二年来首次突破“7”,受此影响,指数继续下跌,上证50指数跌幅最大。

这一周的整体跌幅很大,市场已经进入短期技术性超卖,目前来看,后面可能会进入震荡阶段。

个人定投,目前亏损9.22%。

程序员欢乐送(第31期)

快到8月中旬了,继续补仓,拉低成本。

股市在跌,国际金价创6年新高。

支付宝的博时黄金,近1月涨幅超过8%,金价高达337元/克。

程序员欢乐送(第31期)

如果有定投黄金的朋友,这段时间应该是稳赚了。

最后

本周的程序员欢乐送,到此结束,下周再会。

]]>
https://cuijiahua.com/blog/2019/08/life-39.html/feed/ 1
程序员欢乐送(第30期) https://cuijiahua.com/blog/2019/08/life-38.html https://cuijiahua.com/blog/2019/08/life-38.html#comments Fri, 02 Aug 2019 01:14:10 +0000 https://cuijiahua.com/?p=6388 程序员欢乐送(第30期)

对于我来说,一直保持的追求有三点:技术、快乐、财富。因此,从此三点出发,记录过去一周,我所看到的,值得分享的内容,每周五把欢乐送达。

技术

1、And the bit goes down

深度学习热潮席卷以来,工业界的人们一直考虑如何将深度学习算法落地到嵌入式平台。在嵌入式平台上实现高效的神经网络,不是一件容易的事情。

面对不同的应用场景,性能、功耗、成本是不得不权衡的问题。这也导致人们往往需要在模型精度和模型计算速度之间做一个权衡。

以往人们的主流选择都是MobileNets或ShuffleNets这类的高效精简框架。

现在,我们又多了一个选择。Facebook提出了一种适用于ResNet系列网络架构的压缩方法:Bit Goes Down。

这种方法利用了结构化量化算法PQ(Product Quantization)中卷积的高相关性,重点关注activations的重建,而不是权重本身。

该算法是让未经压缩的神经网络充当“老师”,利用提炼(distillation)技术来指导“学生”网络的压缩。

这一过程无需任何标记数据,是一种无监督学习方法。

程序员欢乐送(第30期)

项目地址:点击查看

2、SlimYOLOv3

这是一个无人机目标快速检测算法,作者对YOLOv3进行了剪枝,参数量、占用内存、推断时间大幅减少的情况下,在无人机目标检测数据集上实现了与原算法可比较的检测精度。

算在在YOLOv3-SPP3基础上进行了改进,在精度稍有下降的情况下,预测时间、参数量、模型大小都减少了很多。

程序员欢乐送(第30期)

检测效果如下:

程序员欢乐送(第30期)

项目地址:点击查看

3、ERNIE 2.0

2019年3月,百度正式发布NLP模型ERNIE,其在中文任务中全面超越BERT一度引发业界广泛关注和探讨。

经过短短几个月时间,ERNIE再次升级,发布语义理解框架ERNIE 2.0,及预训练模型。

程序员欢乐送(第30期)

该项目使用PaddlePaddle深度学习框架,感兴趣的可以看一下。

项目地址:点击查看

4、Antialiased CNNs

大家都知道:图像主体位置变了,CNN可能就不认识这个图片了。

原因就在降采样身上。不管是最大池化,跨步卷积,还是平均池化,都对平移太敏感。

虽然,有著名的抗锯齿 (Anti-Aliasing, AA) 方法,致力解决这个问题。但把这种模块直接放进网络中,会严重影响模型的表现。

近期,Adobe的研究者让让抗锯齿和各种降采样和平共处了,在保留平移不变性的情况下,还能提升ImageNet上的分类准确率,VGG、ResNet、DenseNet等各种架构都适用。

可以看下Anti-aliased方法与Baseline的效果对比,效果提升很明显。

程序员欢乐送(第30期)

项目地址:点击查看

5、EXTD

这是一个人脸检测算法,与传统人脸检测算法不同的是,该算法是针对"小脸"设计的。

程序员欢乐送(第30期)

图片中占比很小的脸,也能使用该算法检测出来。

项目地址:点击查看

6、TOM-Net

透明物体扣取算法听过吗?

TOM-Net算法是一种基于折射率流的方法处理图像中透明物体的抠取,将透明物体的抠取问题转换为了折射率流估计问题。

模型分为两部分,一部分是多尺度的编码-解码网络用于预测粗糙结果,随后利用残差模型来优化结果,模型的输出为目标的掩膜、透射率图和折射率流。

为了训练这一模型,研究人员基于COCO数据集合成了178k的透明物体数据集,同时利用14个透明物体在60个背景下采集了876张真实图像。实验结果表明这种方法可以高效快速的处理透明物体的抠取,同时也可以方便地集成到已有的抠图方法中去。

程序员欢乐送(第30期)

使用该算法,可以将透明材质的牛模型,扣出,方便合成到任意图片中去。

项目地址:点击查看

7、Fairseq

近期,Facebook对已开源的fairseq的PyTorch版本:fairseq-py,进行了升级。

添加了RoBERTa和wav2vec算法的代码和预训练模型,感兴趣的朋友可以看下。

Fairseq是一个序列建模工具包,允许研究人员和开发人员为翻译、总结、语言建模和其他文本生成任务训练自定义模型,它还提供了各种Seq2seq模型的参考实现。该github存储库包含有关入门、训练新模型、使用新模型和任务扩展Fairseq的说明。

程序员欢乐送(第30期)

项目地址:点击查看

快乐

1、电影院买的蜘蛛侠可乐杯

程序员欢乐送(第30期)

程序员欢乐送(第30期)

程序员欢乐送(第30期)

2、淘宝声明

程序员欢乐送(第30期)

财富

工作几个月,突然发现,到手工资竟然越来越少,对比发现个人所得税增加了很多。

研究一下发现,个税的税率是按照累计预扣预缴应纳所得税额计算的。

程序员欢乐送(第30期)

个人所得税公式:

个人所得税=(应纳税收入-减除费用-专项扣除-专项附加扣除+其他参与计税项)x预扣率-速算扣除数-特殊减免

括号里的部分,就是所说的累计预扣预缴应纳所得税额

公式看起来挺复杂,可以分开看。

应纳税收入,就是你每月的工资。

减除费用,就是5000元个税起征点,月薪低于5000就不用纳税。

专项扣除,就是“三险一金”,包括:

  • 基本医疗保险
  • 失业保险
  • 基本养老保险
  • 住房公积金

专项附加扣除,就是专项减免政策,包括六个部分:

  • 子女教育
  • 继续教育
  • 大病医疗
  • 住房租金
  • 住房贷款利息
  • 赡养老人

其他参与计税项,就是那些额外所得,也需要交税的部分。

预扣费,就是上表中的,不同档,不同的扣费标准,最低是3%。

速算扣除数,也是表中的数据,不同档,数也不同。

特殊减免,是一种鼓励政策有的时候,才算的,一般都为0。

可能有些绕,具体怎么缴,举个例子。

北漂小王,身体健康,月薪20000元。无房无车,刚毕业在北京租房住,父母也没有退休。

从基本情况可以看出,专项附加扣除,只有一个住房租金,即每个月1500元免征额。

为了方便计算,“三险一金”等专项扣除,记为4300元。同时,每月减除费用5000元。

开始计算个人所得税,计算5个月的情况,看一下。

1月份:

(20000-5000-4300-1500)*3% = 276,此时累计预扣预缴应纳所得税额为20000-5000-4300-1500=9200,没有超过36000,所以预扣率为3%。

2月份:

(20000*2-5000*2-4300*2-1500*2)*3% - 276(1月份税)= 276,此时累计预扣预缴应纳所得税额为18400,没有超过36000,所以预扣率为3%。

3月份:

(20000*3-5000*3-4300*3-1500*3)*3% - 276 - 276 = 276,此时累计预扣预缴应纳所得税额为27600,没有超过36000,所以预扣率为3%。

4月份:

(20000*4-5000*4-4300*4-1500*4)*10% - 2520 - 276*3 = 332,此时累计预扣预缴应纳所得税额为36800,超过36000,没有超过144000,所以预扣率为10%。

5月份:

(20000*5-5000*5-4300*5-1500*5)*10% - 2520 - 276*3 - 332 = 920,此时累计预扣预缴应纳所得税额为46000,超过36000,没有超过144000,所以预扣率为10%。

越到年末,税越多,到手的钱也就越少。

此外,近期刚刚又有了北京市社保及公积金缴费基数调整的通知,社保及公积金基数根据个人上一年的平均月工资来核定。

这钱啊,越来越难算了。

最后

本周的程序员欢乐送,到此结束,下周再会。

]]>
https://cuijiahua.com/blog/2019/08/life-38.html/feed/ 2
程序员欢乐送(第29期) https://cuijiahua.com/blog/2019/07/life-37.html https://cuijiahua.com/blog/2019/07/life-37.html#comments Fri, 26 Jul 2019 01:19:17 +0000 https://cuijiahua.com/?p=6351 程序员欢乐送(第29期)

对于我来说,一直保持的追求有三点:技术、快乐、财富。因此,从此三点出发,记录过去一周,我所看到的,值得分享的内容,每周五把欢乐送达。

技术

1、Apollo-11

1969年7月20日,阿波罗11号载人飞船登月成功,阿姆斯特朗与奥尔德林成为了首次踏上月球的人类。

为了纪念这一事件,50年后,用户Chris Garry在GitHub上传了阿波罗11号的代码,总共14.5万行,主要涉及制导计算机(AGC)中指令模块(Comanche055)和登月模块(Luminary099)。

程序员欢乐送(第29期)

代码虽然看不懂,凑个热闹看一看,还是可以的。

项目地址:点击查看

2、算法可视化工具

程序员,数据结构是基础。做算法,做工程,做测试,都需要对数据据结构有所掌握,数据结构也算是程序员的一种“内功”。

初学数据结构,可能理解一些算法有些费劲。这时,算法运行过程的可视化工具就提供很大帮助。

比如一个排序算法快排,使用这个工具,你可以很好的看到算法的运行过程。

程序员欢乐送(第29期)

当然,上图是加速的效果,运行步骤进行的快慢是可以调节的。

网站地址:点击查看

3、OmniNet

Transformer是一种广受欢迎的神经网络架构,特别是用在自然语言理解任务中。这篇论文提出了一种可扩展的统一神经网络架构:OmniNet。

该网络可以学习空间维度和隐层所对应的时间维度信息。它的独特之处在于,可以支持多模态输入,以及异步多任务学习。

例如,OmniNet 可以同时学习词性标注、视频标注、图像问答、和视频活动识别信息,使用该模型同时训练四个任务,比分开训练四个模型,要节省很多空间,且性能和单独训练每个任务的模型一致。

程序员欢乐送(第29期)

项目地址:点击查看

4、对抗性图像

随着深度学习的发展,越来越多的图像识别视觉任务应用到各个产品中。

但基于深度学习的图像识别技术也会在“对抗性图像”上犯错。例如,当你看到树上有一只猫时,图像识别模型可能看到的是一只松鼠。

程序员欢乐送(第29期)

这类非常规的数据,就是一种困难样本。

这次介绍的就是这样一个困难样本集,这些数据有望帮助培养更强大的视觉系统。

利用深度学习创建的视觉系统是“浅薄”和“脆弱”的,它们不会像人一样灵活地理解世界上的一些几乎相同的细微差别。

感兴趣的可以看下。

项目地址:点击查看

5、C^3 Framework

C^3 Framework是一个基于PyTorch的开源人群计数框架。

近两年,有关人群计数的文章呈现出爆炸式增长。然而,人群计数不像其他任务(目标检测、语义分割等)有着简洁/易开发的开源代码框架,大大降低了我们对于idea的验证效率。

为了解决这些问题,C^3 Framework框架应运而生。

这个框架提供了六个主流的数据预处理代码,并提供了适用于人群计数的修改后的AlexNet,VGG,ResNet等网络框架。

程序员欢乐送(第29期)

项目地址:点击查看

6、SARPN

SARPN是一种基于残差金字塔的单目深度估计方法,场景的结构和目标的细节决定了深度图重建的效果,对于室内深度估计来说,全局结果针对布局而局域结构则反映了物体表面的细节。

论文从多尺度地角度来分析深度估计的问题,采用了残差金字塔解码器,在顶层表达全局布局在底层表达表面细节。

每一层及的残差模块都预测对应的尺度,并从前一级粗糙的尺度上预测后一级更为精细的尺度。为了充分探索多尺度图像特征,自适应稠密特征融合被用于对多尺度的特征进行融合,并在NYU-Depth-v2上取得了良好的效果。

程序员欢乐送(第29期)

 

项目地址:点击查看

7、iFood数据集

iFood是一个细粒度食物分类数据集, 包含了251个细粒度的食物分类供158k张图像,这是斯坦福国际研究所和康奈尔大学发布的数据集。

程序员欢乐送(第29期)

项目地址:点击查看

快乐

1、我为什么腰疼

程序员欢乐送(第29期)

2、当代近视年轻人的点餐方式

程序员欢乐送(第29期)

财富

银行理财中,银行创新存款一直受大众的追捧。

特点是安全性蛮高的,而且利率稳定,不会上下浮动。

这类存款,属于活期存款,随时都可存取。

这类产品一般分档计息,持有时间不同,对应不同档次利率。

程序员欢乐送(第29期)

基本上,存一个月可高到4.2%左右收益,能随时取出。

放的时间更久,收益更高。

这要比普通的活期存款收益高不少。

比如蓝海银行的蓝贝贝,存满3个月4.2%,6个月4.5%。

程序员欢乐送(第29期)

银行这类理财产品有不少,多看一看,找个自己放心的。

最后

本周的程序员欢乐送,到此结束,下周再会。

]]>
https://cuijiahua.com/blog/2019/07/life-37.html/feed/ 4
程序员欢乐送(第28期) https://cuijiahua.com/blog/2019/07/life-36.html https://cuijiahua.com/blog/2019/07/life-36.html#comments Fri, 19 Jul 2019 01:00:01 +0000 https://cuijiahua.com/?p=6245 程序员欢乐送(第28期)

对于我来说,一直保持的追求有三点:技术、快乐、财富。因此,从此三点出发,记录过去一周,我所看到的,值得分享的内容,每周五把欢乐送达。

技术

1、视频图像修复

图像修复是一个有趣的方向,基于神经网络的图像修复方法的鼻祖是Context-Encoders,它采用CNN+GAN的方式对图像进行修复,其在图像修复领域的地位堪比董超的SRCNN在单张超分辨重建的地位,该论文也2016 CVPR收录。

后续基于深度学习的图像修复方法层出不穷,各有特色。例如,曾经在《程序员欢乐送(第6期)》中提到过的EdgeConnect算法,该算法从艺术家的作画方法中得到灵感,即线条优先,颜色次之。

近期,基于视频的图像修复技术有了新进展。Deep Flow-Guided不再是直接填充每个帧的 RGB 像素,而是将其转化为像素点扩充问题。

该方法使用新设计的深度光流场合成神经网络(DFC-Net)在视频帧上合成表示空间与时间关系的光流场,即整个视频图像中各像素点随时间的运动情况;然后将这个光流场作为像素扩充的导向,使其精确填充视频中的缺失区域。最终,以合成光流场作为导向则可精确填充缺失的视频区域。

一起看下效果吧。

《疯狂动物城》里的兔兔朱迪,被用红色标注了,表明要被去除。

程序员欢乐送(第28期)

去除轻松,但是修复去除后的图像修复是关键。

程序员欢乐送(第28期)

效果不错吧,感兴趣的可以看下。

项目地址:点击查看

2、Gradio

Gradio是一个开源的Python库,只需要几行代码,就可以帮助研究人员与其他人进行交流,可以通过网页轻松展示CV、NLP模型的效果。

程序员欢乐送(第28期)

最近,Gradio项目又上线了ML模型展示平台GradioHub,供所有开发者上传自己的模型。

项目地址:点击查看

3、AB3DMOT

3D 多目标跟踪在自动驾驶和机器人领域具有重要应用,其意为跟踪检测到的物体包围框位于 3D 空间(点云)而非 2D 平面。

近日,卡内基梅隆大学开源一个强大的3D多目标跟踪代码,在其论文中,作者详述了算法思路和实验结果。作者称其为baseline,该算法框架简单,使用的各个模块算法也是直接使用或者稍微改进现有算法。

尽管算法简单,但该代码在著名的KITTI 车辆多目标跟踪数据集上,将3D 多目标跟踪精度(MOTA)从 72.23提高到76.47。

更为难能可贵的是,算法运行速度也非常快。

程序员欢乐送(第28期)

项目地址:点击查看

4、面试题库

一年一度的秋招又开始了,不知道关注公众号的朋友,有多少是2020年的应届毕业生。

推荐一个互联网公司的2019年面试题库,有需要的朋友自取。

这个题库涵盖阿里,腾讯,百度,美团,头条等技术面试题目,以及答案,2019年新鲜出炉的大汇总。

对于想要从事软件开发工程师工作的人,帮助很大;对于想从事算法相关岗位的人,也有一定的借鉴意义。

程序员欢乐送(第28期)

项目地址:点击查看

5、Python速查表

这是一份对Python用户非常友好的资源,Python Cheatsheet。

它可以帮助我们快速查询Python的一些基础用法,有时忘记了一些方法的使用,可以通过这个速查表快速查阅,简单高效。

程序员欢乐送(第28期)

项目地址:点击查看

6、动图生成

来自三星莫斯科 AI 中心和 Skolkovo 科学技术研究所的研究人员创建了一个模型,利用这个模型可以从一张图像中生成人物头像的动图,而且是开口说话的动图。

这是一个今年年初的一个研究工作,近日,刚刚开源。

开口说话的蒙娜丽莎。

程序员欢乐送(第28期)

项目地址:点击查看

7、pytorch-transformers

pytorch-transformers是一个API工具包,通过这个工具包,可以调用27个NLP预训练模型,包括最近很火的BERT、GPT-2、XLNet等,简单易用。

从模型分析到生产加速,对自然语言处理研究人员来说,简直是一库在手,天下我有。

目前这个库中包含PyTorch实现,预训练模型权重文件,数据集和六个模型的转换工具。

程序员欢乐送(第28期)

项目地址:点击查看

快乐

1、夜里做了美丽的噩梦

2、像极了小时候拿到奖状的我

财富

逛知乎发现的一个很不错的总结,分享一下。

理财你最该懂的十大基本知识

1、关于收益率

假如你有100万,收益100%后资产达到200万,如果接下来亏损50%,则资产回到100万,显然亏损50%比赚取100%要容易得多。

2、关于涨跌停

假如你有100万,第一天涨停板后资产达到110万,然后第二天跌停,则资产剩余99万;反之第一天跌停,第二天涨停,资产还是99万元。

3、关于波动性

假如你有100万,第一年赚40%,第二年亏20%,第三年赚40%,第四年亏20%,第五年赚40%,第六年亏20%,资产剩余140.5万元,六年年化收益率仅为5.83%,甚至低于五年期凭证式国债票面利率。

4、关于每天1%

假如你有100万,每天不需要涨停板,只需要挣1%就离场,那么以每年250个交易日计算,一年下来你的资产可以达到1203.2万,两年后你就可以坐拥1.45亿。

5、关于10年10倍

假如你有100万,希望十年后达到1000万,二十年达到1亿元,三十年达到10亿元,那么你需要做到年化收益率25.89%。

6、关于补仓

如果你在某只股票10元的时候买入1万元,如今跌到5元再买1万元,持有成本可以降到6.67元,而不是你想象中的7.50元。

7、关于持有成本 
如果你有100万元,投资某股票盈利10%,当你做卖出决定的时候可以试着留下10万元市值的股票,那么你的持有成本将降为零,接下来你就可以毫无压力的长期持有了。如果你极度看好公司的发展,也可以留下20万市值的股票,你会发现你的盈利从10%提升到了100%,不要得意因为此时股票如果下跌超过了50%,你还是有可能亏损。

8、关于资产组合

有无风险资产A(每年5%)和风险资产B(每年-20%至40%),如果你有100万,你可以投资80万无风险资产A和20万风险资产B,那么你全年最差的收益可能就是零,而最佳收益可能是12%,这就是应用于保本基金技术的雏形。

9、关于赌场赢利

分析了澳门赌客1000个数据,发现胜负的概率为53%与47%,其中赢钱离场的人平均赢利34%,而输钱离场的人平均亏损是72%,赌场并不需要做局赢利,保证公平依靠人性的弱点就可以持续赢利。股市亦如此。

10、关于正态分布
这个世界上很多事物都呈现正态分布,比如天才和蠢蛋的比例很少,多数的庸庸碌碌的大众,也比如社会财富的分配,富人和穷人也呈现正态分布,人类的身高、体重等等太多的事物都呈现正态分布。无论牛熊市,所有股票的涨跌幅和大盘相比也会呈现正态分布,能沅超越指数上涨的股票最终只是少数。当你想取得超额的时候,一定是你某项因素或是某项能力也同样达到了正太分布的那偏正的极小区域。如果你没有这样能力,该怎么办呐?当然了,命好是投资的核心竞争力,但不要忘记,命运好坏也会是正态分布的。

人生就是个复利的过程,最后能得到什么,取决于之前积累了什么。努力做个+∞的人。

摘自知乎:点击查看

最后

本周的程序员欢乐送,到此结束,下周再会。

]]>
https://cuijiahua.com/blog/2019/07/life-36.html/feed/ 6
程序员欢乐送(第27期) https://cuijiahua.com/blog/2019/07/life-35.html https://cuijiahua.com/blog/2019/07/life-35.html#respond Fri, 12 Jul 2019 01:03:21 +0000 https://cuijiahua.com/?p=6190 程序员欢乐送(第27期)

对于我来说,一直保持的追求有三点:技术、快乐、财富。因此,从此三点出发,记录过去一周,我所看到的,值得分享的内容,每周五把欢乐送达。

技术

1、吃鸡版超级玛丽

前段时间,一国外友人InfernoPlus竟然将吃鸡和超级玛丽相结合,自制一款网页游戏《Mario Royale》又名《超级马里奥大逃杀》,很好的诠释了万物皆可大逃杀。

先来张游戏效果图感受一下。

程序员欢乐送(第27期)

还是原来的背景、怀旧的音乐、熟悉的角色,但猪脚不再是一个,规则也不再温和。既然是大逃杀,该有的残酷还是要有的。不同的是玩家可以用龟壳淘汰其他玩家,也可以吃了星星之后往别人身上撞来淘汰别人。剩下的,就靠你自己的操作和对关卡的理解了。最终先通关的,就算胜利。

不过由于版权问题,该游戏上线没多久,就被叫停了,不过现在代码已经开源,感兴趣的可以看下。

项目地址:点击查看

2、在线PS

有网上写作习惯的朋友,应该或多或少都需要对图片进行一定的编辑工作。裁裁剪剪,扣个背景,压缩个图片大小的工作,完全可以通过在线PS网站解决,还是挺方便的。

程序员欢乐送(第27期)

当然,这个在线PS没有软件PS的功能那么强大,但胜在方便。同时,还有一些在线素材可供使用,资源还是挺丰富的,喜欢在线编辑图片的朋友,可以试试。

网站地址:点击查看

3、代码自动补全

智能补全代码早已不是梦想,各种IDE和插件都在努力帮助程序猿减少击键次数,比如获得了Trith Ventures投资的Kite。

全球有超过3万名Python开发人员使用Kite,它被誉为当前最好用的Python自动补全工具。不仅能补全代码,Kite还能帮你跳过文档了解到别人是如何实时使用函数的,同时,它也能提供你的自定义代码库里的定义和用法,连Python之父都不禁为Kite点赞。

如果你想学习起背后的一些原理,我想接下来介绍的开源项目应该会对你有所帮助。

近日,有位来自斯里兰卡的程序猿尝试用简单的深度学习模型来实现自动补全Python代码这个目标,效果意外的不错。

在这个项目中,斯里兰卡小哥用到的只是一个简单的LSTM模型。如此简单的模型下,使用深度学习来自动补全Python代码,仍可以减少30-50%的击键次数。

程序员欢乐送(第27期)

绿色的字母就是自动补全开始的位置,按下TAB键选择补全,高亮标注为灰色的部分就是AI补充的代码。

项目地址:点击查看

4、人机对话模型ESIM

这是阿里开源的一个人机对话模型,这一研究已被谷歌、Facebook等在内的研究者在论文中引用200多次,也一度在国际顶级对话系统评测大赛(DSTC7)上获得双料冠军,将人机对话准确率的世界纪录提升至94.1%。

程序员欢乐送(第27期)

项目地址:点击查看

5、推荐模型 DLRM

随着深度学习的出现,基于神经网络的个性化和推荐模型已经成为包括 Facebook 等公司构建推荐系统的重要工具。然而,这些模型与其他深度学习模型有很大的不同,因为它们必须能够处理用于描述高级属性的分类数据。对于一个神经网络来说,有效地处理这类稀疏的数据是很有挑战性的,而且由于公开的代表性模型和数据集细节的缺乏,减缓了其研究进展。

为了有助于加深人们对这一子领域的理解,Facebook 开源了一个最先进的深度学习推荐模型(DLRM),该模型是使用 Facebook 开源的 PyTorch 和 Caffe2 平台实现的。DLRM 通过将协同过滤和基于预测分析的方法的原理结合起来,改进了其他模型,从而使其能够有效地处理工业规模的数据,并提供最先进的结果。

程序员欢乐送(第27期)

该模型使用了各种硬件和系统组件,如内存容量和带宽,以及通信和计算资源。

项目地址:点击查看

6、DeepFaceLab

换脸一直很火,有很多的demo可以玩,例如曾经推荐过的Faceswap等,不过这些开源代码都需要对环境进行配置,需要一定的环境搭建基础,试玩成本相对较高。

DeepFaceLab也是一个开源的换脸算法,不过它的优势是集成了环境,在cpu的机器也可以运行,相对来说,更方便一些。

程序员欢乐送(第27期)

项目地址:点击查看

7、深度强化学习

深度学习DL大家应该都知道,分为有监督和无监督学习。强化学习RL应该也都了解,它是通过对未知环境一边探索一边建立环境模型以及学习得到一个最优策略。

那么深度强化学习DRL,你了解多少呢?DRL是将深度学习DL的感知能力和强化学习RL的决策能力相结合, 可以直接根据输入的信息进行控制,是一种更接近人类思维方式的方法。

想要学习DRL,可以看看接下来推荐的干货教程。

这份Pytorch强化学习教程一共有八章,从DQN(Deep Q-Learning)开始,步步深入,最后向你展示Rainbow到底是什么。

不仅有Jupyter Notebook,作者还在Colab上配置好了代码,无需安装,你就能直观地感受到算法的效果,甚至还可以直接在手机上进行学习,运行代码,非常方便。

程序员欢乐送(第27期)

项目地址:点击查看

Jupyter地址:点击查看

Colab地址:点击查看

快乐

1、灵魂六问

程序员欢乐送(第27期)

2、我生活中的主要矛盾

财富

上海垃圾分类执行也快半个月了,垃圾分错了是要扣钱的。

除了上海,其他城市也会陆续执行垃圾分类政策,算是一个趋势吧。

为了避免被扣钱,损失不必要的钱财,好好学习一下还是有必要的。

一些公司和个人也开始陆续推出相应的垃圾分类助手,帮助人们对垃圾进行分类。说下几款已知的小助手吧。

微信小程序,可以直接搜索“垃圾分类精灵”。

程序员欢乐送(第27期)

小程序有两种搜索功能:文字输入和拍照识别。

除了这两个功能外,还有一些简单的问卷测试题,以供学习。

支付宝小程序,可以直接搜“垃圾分类向导”。

程序员欢乐送(第27期)

支付宝的小程序和微信的小程序从功能上看是很类似的。

这两个小程序,都是个人开发者做的。通过微信小程序的版权信息中可以看出,图像识别应该采用的是百度AI开放平台提供的通用图像分析技术实现的。支付宝小程序的图像识别,是否采用类似的接口,不得而知。但测试了一些图片,从识别准确率上来看,两者水平基本持平。

说完了,个人的开发者,再看看公司的产品。

淘宝APP,目前已经支持垃圾分类识别,打开淘宝APP,使用拍照功能,就可以看到垃圾识别入口了。

程序员欢乐送(第27期)

不过淘宝APP,这个垃圾分类,只能是拍照识别,不能进行文字输入。

这个功能刚上线的时候,识别准确率有些低,不过经过一段时间的优化,目前准确率已经比垃圾分类精灵和垃圾分类向导高出一些了。

除了阿里,百度也在做类似的功能,目前是仅支持文字输入,用手机浏览器百度搜索xxx是什么垃圾,会有相应的分类结果。此外,百度APP近期也会在拍照功能入口处,上线垃圾分类图像识别功能,感兴趣的朋友可以关注下。

最后

本周的程序员欢乐送,到此结束,下周再会。

]]>
https://cuijiahua.com/blog/2019/07/life-35.html/feed/ 0
程序员欢乐送(第26期) https://cuijiahua.com/blog/2019/06/life-34.html https://cuijiahua.com/blog/2019/06/life-34.html#comments Fri, 28 Jun 2019 01:30:18 +0000 https://cuijiahua.com/?p=6155 程序员欢乐送(第26期)

对于我来说,一直保持的追求有三点:技术、快乐、财富。因此,从此三点出发,记录过去一周,我所看到的,值得分享的内容,每周五把欢乐送达。

技术

1、树莓派4

不知道有没有和我一样,本科是自动化的。

身为自动化专业的学生,对树莓派应该一点都不陌生,都曾幻想着用树莓派做个家庭自动化工具、Web服务器、家用VPN等各式各样的小而美的工具。

尽管真相往往是买回来放着“吃灰”,但无法阻挡我们的热爱。

近期,树莓派(Raspberry Pi 4)第四代发布。

这是有史以来最强大的树莓派,性能强大、重新改写“黄金标准”的树莓派。

当然,也是有史以来最贵的树莓派——顶配55美元(378元)。

程序员欢乐送(第26期)

喜欢做自己的小玩具的朋友,可以买来玩一玩。

官网地址:点击查看

2、Speech-Driven Animation

这是一个有趣的GAN项目。根据一段音频和一个人物静态图,可以生成一个嘴型可以对上这段音频的人物说话视频。

例如,可以使用一张爱因斯坦的图片和一段音频,可以生成如下的假视频:

项目地址:点击查看

3、Obj-GAN

不得不感慨的是,GAN网络的研究越来越多了。Obj-GAN也是近期的研究成果。

让AI认得图像,根据自己的理解给出一段叙述,已经不是什么新鲜事了。从图像到文字容易,把这个过程反过来却很难。

Obj-GAN的功能就是:给它一句描述,它就能根据描述作画。

这是微软和京东AI研究院合作提出的方法,Obj-GAN可以理解一段说明文字,生成草图布局,并根据确切描述完善图像细节。

程序员欢乐送(第26期)

虽然生成的效果一般,但这确实是一个好玩有趣的方向,感兴趣的朋友可以看下。

项目地址:点击查看

4、XLNet

谷歌大脑和CMU联合团队提出面向NLP预训练新方法XLNet,性能全面超越此前NLP领域的黄金标杆BERT,在20个任务上实现了性能的大幅提升,刷新了18个任务上的SOTA结果。

XLNet引入了自回归语言模型以及自编码语言模型的提法,对于阅读理解类任务,相对Bert,性能有极大幅度地提升。

程序员欢乐送(第26期)

项目地址(tensorflow):点击查看

项目地址(pytorch):点击查看

5、MASS

MASS是微软亚洲研究院开源全新的通用预训练方法。

BERT 和 XLNet 在自然语言理解任务(例如:情感分类、自然语言推理和 SQuAD 阅读理解)方面取得了巨大成功。

然而, NLP 领域除了自然语言理解任务之外,还存在很多序列到序列的语言生成任务,例如机器翻译、文本摘要生成、对话生成、问答、文本风格转换等。对于这些任务,使用编码器-注意力-解码器框架是主流方法。

MASS在此类序列到序列的语言生成任务中,表现更好。

程序员欢乐送(第26期)

项目地址:点击查看

6、Chinese-BERT-wwm

很多自然语言处理针对的语言都是英文,为了进一步促进中文自然语言处理的研究发展,哈工大和科大讯飞联合发布了Chinese-BERT-wwm,它提供了中文全词覆盖(Whole Word Masking)BERT的预训练模型。

该项目在多个中文数据集上得到了较好的结果,覆盖了句子级到篇章级任务。同时,对现有的中文预训练模型进行了对比,并且给出了若干使用建议。

程序员欢乐送(第26期)

项目地址:点击查看

7、FALdetector

PS很强大,拍照一分钟,P图俩小时,变美变帅,不在话下。

近期,Adobe发布“反向PS利器”,知道你修了哪,再帮你修回去,一秒回到解放前。

Adobe官方推出的新杀器充满了恶意,一能识别哪张照片修过了,二能看出修了哪里,三能还原最初的模样:

程序员欢乐送(第26期)

人艰必拆的节奏啊~

项目地址:点击查看

快乐

1、抗寒蚊子

程序员欢乐送(第26期)

感谢 @蚕豆味蟹黄 投稿。

2、好有道理

程序员欢乐送(第26期)

财富

有朋友在后台留言,对理财一窍不通,有什么适合理财入门的书籍吗?

没看过太多关于理财的书,但是可以推荐下我的理财启蒙书:《穷爸爸,富爸爸》。

如果没有看过的朋友,还是推荐看一下的。这本书,大名鼎鼎,是许多人理财的起点。

穷爸爸富爸爸就是有一种入门魔力,让你走进完全陌生的理财世界,看到金钱世界里纷飞的交易数字,能够看到真正赚钱的玩法。

对于新手构建基本的理财观念非常友好。

故事从作者的亲生父亲(穷爸爸)和朋友迈克的父亲(富爸爸)对他的影响开始讲起。

穷爸爸:为钱工作,努力学习专业,努力工作攒钱,但财务上永远是在捉襟见肘;

富爸爸:让钱为自己工作,努力让资产赚钱,实现了人生的财务自由。

作者选择了向后者学习,而且47岁就和妻子退休,享受生活,当然,这是在依然有被动收入的情况下。

可以简要概括下书中所讲的道理:

  • 努力找个赚钱多的好工作
  • 如果找不到好工作,就节约开支存钱
  • 把存下来的钱买资产,绝不持币,让钱生钱
  • 资产就是可以给你带来被动收入的东西
  • 当被动收入超过你的开支的时候,你可以把所有的时间拿来创业
  • 奔向财务自由

每个人看完这本书都会有不同的感受,有时间的,可以自行品味一番。

除了这本启蒙书,其他的理财知识,我都是在网上学习的。

刚开始想玩股票,就在网上找股票的知识,学习股票基础,学习k线、KDJ、MACD等指标。学完理论知识,开始实操。

所以,看完理财的启蒙书后,可以根据个人喜好,去找资料,先学理论后实践。

不过有一点要记住,一定不要涉足自己不了解的领域,充分了解学习后,再动手不迟。

最后

本周的程序员欢乐送,到此结束,下周再会。

]]>
https://cuijiahua.com/blog/2019/06/life-34.html/feed/ 5
程序员欢乐送(第25期) https://cuijiahua.com/blog/2019/06/life-33.html https://cuijiahua.com/blog/2019/06/life-33.html#comments Fri, 21 Jun 2019 01:02:25 +0000 https://cuijiahua.com/?p=6114 程序员欢乐送(第25期)

对于我来说,一直保持的追求有三点:技术、快乐、财富。因此,从此三点出发,记录过去一周,我所看到的,值得分享的内容,每周五把欢乐送达。

技术

1、Snapchat变性滤镜

Snapchat是由斯坦福大学两位学生开发的一款“阅后即焚”照片分享应用。利用该应用程序,用户可以拍照、录制视频、添加文字和图画,并将他们发送到自己在该应用上的好友列表。这些照片及视频被称为“快照”("Snaps"),而该软件的用户自称为“快照族(snubs)”。

Snapchat近期的变性滤镜受到用户的好评,可以男变女:

程序员欢乐送(第25期)

也可以女变男,有女网友用这个功能,送给了男朋友一个惊喜:

程序员欢乐送(第25期)

这么好玩的滤镜,抖音也会抓紧跟上吧。

2、《while True: learn()》

《while True: learn()》是一款Steam平台发布的游戏,它是个解谜/模拟类游戏,涵盖了机器学习、神经网络、大数据、人工智能的丰富知识点和实用方法,可谓热爱机器学习的游戏党的福音。

程序员欢乐送(第25期)

游戏中,你是一个菜鸟程序员,单身狗的你只有猫主子陪伴,你像往常一样写着bug。无头绪的时候,出门倒杯咖啡,回来发现bug被猫修复了。

你想问问它怎么做到的,却只听到喵喵喵。于是,你下定决心要造出一套喵语识别系统

因此你开始学习机器学习,游戏都帮你规划好了学习路线:

从决策树,到随机森林,到梯度下降……各种方法背后的原理,都能在这里学到。

程序员欢乐送(第25期)

感兴趣的可以玩一下,游戏仅需43元。

游戏地址:点击查看

3、Pytorch hub

别看错,不是PxxxHub,是Pytorch hub。

Pytorch hub是Facebook推出的,是一个包含计算机视觉、自然语言处理领域的诸多经典模型的聚合中心,让你调用起来更方便。

无论是ResNet、BERT、GPT、VGG、PGAN还是MobileNet等经典模型,只需输入一行代码,就能实现一键调用。

程序员欢乐送(第25期)

类似的工具包还有Gluon CV、TorchCV等。

Facebook官方博客表示,PyTorch Hub是一个简易API和工作流程,为复现研究提供了基本构建模块,包含预训练模型库

发布首日已有18个模型“入驻”,获得英伟达官方力挺。而且Facebook还鼓励论文发布者把自己的模型发布到这里来,让PyTorch Hub越来越强大。

项目地址:点击查看

4、CRAFT-pytorch

CRAFT-pytorch一个基于单个字符和字符间亲和力的场景文本检测工程。

程序员欢乐送(第25期)

与先前基于bbox、语义分割和字符检测的方法不同,该算法使用单个文字的标记和文件的亲和力来实现更好的文字检测效果。同时提出了一个从合成数据标记文字位置、从真实数据估计文章位置的框架。

项目地址:点击查看

5、Replica Dataset

Replica Dataset是Facebook发布的一个高质量的3D重建室内场景数据集。

程序员欢乐送(第25期)

可以看到,重建的数据高度还原了室内的场景,包括各个室内物品的纹理,还原的信息质量很高。同时也提供了场景的语义信息。

项目地址:点击查看

6、Real-Time Voice Cloning

这是一篇NeurIPS 2018的论文开源的项目,论文简称为SV2TTS,文中提出的方法很有趣。

简单的说明就是:算法可以根据几秒录音,学习音频里人的说话音色、音调。随后即可根据指定文本内容生成语音。

很强大!

程序员欢乐送(第25期)

项目地址:点击查看

7、Inverse Cooking

Inverse Cookings是Facebook的一项工作,可以从美食图片生成菜谱和烹饪指南。

算法首先通过自编码器抽取图像特征,随后利用原料解码器预测出各种食材,并编码后送入RNN中来生成烹饪方法。

程序员欢乐送(第25期)

项目地址:点击查看

快乐

1、派出所有人吗?

2、减肥

爸爸说的对,没有任何人有资格让你减肥。

财富

最近的行情不错,股市有所回暖,黄金价格创新高,比特币也一直在涨。

股市,我一直在定投指基,过年一波大涨后,3月末的时候,连本带利全部赎回,算是赚了一波。随后,我又按照计划开始定投,每个月4000。4月、5月连跌俩月,亏损最多的时候是15%。我的止损计划是如果亏损20%就全部赎回。6月中旬继续定投了4000,6月19号迎来了一波高开,回了一波血。

目前,亏损4.83%。未来股市依然看好,会继续定投。

想在是个不错的入场时间,想玩一玩的可以择机入场了。

在股市回调的这段时间里,涨势不错的是黄金。从支付宝的购买黄金入口可以看到近期的涨势,涨幅创6年新高了。

程序员欢乐送(第25期)

可见,合理配置资产还是很有用的,鸡蛋不放在一个篮子里,更安全。黄金我也买了一些,但是不是定投,赚的不多。

比特币,从今年2月份开始,已经连涨了4个多月了,和当年巅峰的价格比起来,现在的价格更容易让人接受。

程序员欢乐送(第25期)

没有买比特币,但是之前有一些零币(ZEC),自己挖矿挖的,零币在币圈普遍大跌之后,也回涨了一波。不过没有比特币回涨这么猛,一天涨20%多。当然,有大起,也会有大落,玩的就是心跳。

理财的机会很多,按照自己的计划执行,不急不躁。

PS:理财有风险,投资需谨慎。

最后

本周的程序员欢乐送,到此结束,下周再会。

]]>
https://cuijiahua.com/blog/2019/06/life-33.html/feed/ 2