发布时间:2023-10-22 08:00
在过去的几年中,机器学习在许多行业中开辟了新的视野,出现了一些高级用例:Facebook的面部识别,Netflix推荐的电影,PrismaAI的图像样式转换,Siri的语音识别,Google Allo的自然语言处理, 而这样的例子不胜枚举。
GitHub上有大量精彩的开源机器学习项目。以下是最受开发者们欢迎的项目列表。我希望通过这些项目能让你学到一些新东西,并激发自己的开发项目灵感。
1、TensorFlow
TensorFlow是一个用于研究和生产的开源机器学习库。 TensorFlow为初学者和专家提供了针对桌面、移动端,Web和云开发的API。TensorFlow最初由Google Brain团队开发,供内部Google使用,并于2015年11月9日根据Apache 2.0开源许可发布。TensorFlow的最新版本支持Keras,这是高级神经网络API,使用Python编写,并且能够在TensorFlow,CNTK或Theano之上运行。 还有用于Javascript和Swift的接口。
2、Scikit-learn
Scikit-learn最初由David Cournapeau在Summer of Code的Google活动中撰写。 它的名称或多或少地引用了SciPy Toolkit。 Scikit-learn具有基于NumPy,SciPy和Matplotlib构建的简单有效的数据挖掘和数据分析工具。 与TensorFlow一起使用是一种流行的选择,因为它简单易用。
3、MXNet
除了TensorFlow,Keras和Scikit-learn,还有Apache的MXNet深度学习框架。 它专为提高效率和灵活性而设计,可让您混合使用符号和命令式编程,以最大限度地提高效率和生产率。 您可以访问MXNet中实现的许多模型动物园。
4、PyTorch
如果没有提及PyTorch,那么这个合集就是不完整的。PyTorch是机器学习爱好者中的另一个流行选择。PyTorch基于Torch,由Facebook作为其机器学习框架分发。PyTorch是一个Python软件包,提供了两个高级功能:具有强大GPU加速功能的Tensor计算(如NumPy)和基于tape的autograd系统构建的深度神经网络。
5、Magenta
Magenta是一个研究项目,旨在探索机器学习在艺术和音乐创作过程中的作用。 首先,这涉及开发新的深度学习和强化学习算法,以生成歌曲,图像,绘图和其他有趣的东西。 但这也是对构建智能工具和界面的一次探索,该工具和界面允许艺术家和音乐家使用这些模型扩展(而不是替换!)他们的过程。
主repo用于Python,但是对于Javascript版本,还有magenta.js。 Magenta是一个完美的项目,展示了我们大多数人从未想到的高级机器学习功能。
6、style2paints
该项目旨在为线条艺术着色。 AI可以根据给定的颜色样式在草图上绘画,创建自己的颜色样式以在草图上绘画或转移其他插图的样式。近期增加了一些新功能,例如图像锚点和图像过渡,值得一看。
7、PyTorch中的图像到图像翻译
该项目包含两个组件-CycleeGAN和pix2pix-包含用于不成对和成对的图像到图像转换的PyTorch实现。 乍一看,它看起来像是另一个相当普通的样式转换解决方案,但是它可以做一些不同的事情,例如将马匹转换为斑马线,或将实时照片转换为莫奈。 而且处理速度足够快,可以用于实时视频。
8、深度语音转换
我们有一些用于图像和视频的样式转换工具,但是语音呢? 深度语音对话是此功能的完美示例。
如果您可以模仿著名名人的声音或像著名歌手一样唱歌怎么办? 该项目的目标是将某人的语音转换为特定的目标语音。 所谓的语音样式转换。 我们致力于这个项目,旨在将某人的声音转换成英国著名女演员凯特·温斯莱特(Kate Winslet)的声音。 我们实现了一个深度神经网络来实现这一目标,并且将Kate Winslet阅读的超过2个小时的有声读物句子用作数据集。
如果您还不确定,请使用Kate Winslet的声音前往SoundCloud进行一些演示。
9、PyTorch中的StarGAN
StarGAN是本文的PyTorch实施:用于多域图像到图像转换的统一生成对抗网络。通过应用不同的发型,皮肤类型,年龄,性别和不同的心情,转换源图像不仅限于样式转换。 这个项目非常棒。
10、人脸检测
这听起来可能并不吸引人,因为现在我们可以借助iOS和Android上的Core ML或ML Kit轻松进行此操作。 但是更深入的了解表明这是多么的棒。 它不仅可以检测面部,还可以检测情绪和性别。使用带有Keras CNN模型和OpenCV的fer2013 / IMDB数据集进行实时面部检测和情绪/性别分类。
化繁为简,简单3步,只需5分钟。
在人工智能愈发热门的大背景下,学习、体验新技术的需求也日渐增多。学以致用才能真正掌握一门技术。
钛灵 AIX是一款集计算机视觉与智能语音交互两大核心功能为一体的人工智能“超级大脑”,搭载 Intel 专业级 AI 加速运算芯片与多种传感技术。它支持边缘深度学习,搭配 Model Play 人工智能模型共享平台,开发者可以轻松将 AI 模型移植到程序中开发应用。
1. 下载预训练并编译好的AI模型
2. 读取模型文件,将图像或音频文件送入模型中,即可获得AI模型的推理结果
3. 将模型的推理结果配合自己编写的python代码,即可以开发一个属于自己的AI小程序