![深度学习从0到1](https://wfqqreader-1252317822.image.myqcloud.com/cover/588/39479588/b_39479588.jpg)
1.4 深度学习的应用
深度学习最早兴起于图像识别,在最近几年可以说是已经深入各行各业。深度学习在计算机视觉、语音识别、自然语言处理、机器人控制、生物信息、医疗、法律、金融、推荐系统、搜索引擎、电脑游戏和娱乐等领域均有应用。
图像识别——图像识别可以说是深度学习最早实现突破性成就的领域。如今计算机对图片的识别能力已经跟人类不相上下。我们把一张图片输入神经网络,经过网络的运算,最后可以得到图片的分类。如图1.15所示,我们可以看到,对于每一张图片,神经网络都给出了5个最有可能的分类,排在最上面的可能性最大。图1.15中的置信度表示的就是该图片的概率值。
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_29_2.jpg?sign=1739220778-sIeJDekhUoRItgA1UuNIWsivhCmNbHvH-0-49c7dc7918ffc19595cde57c9756cbf4)
图1.15 图像识别
目标检测——利用深度学习我们还可以识别图片中的特定物体,然后对该物体进行标注,如图1.16所示。
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_30_1.jpg?sign=1739220778-jDUoILK7xfU7WqiO9RzASnA7livtJ0TF-0-248b51d59c41172d5fc68a41dcd217d0)
图1.16 目标检测[1]
人脸识别——深度学习还可以识别图像中的人脸,判断是男人还是女人,判断人的年龄,判断图像中的人是谁等,如图1.17所示。
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_30_2.jpg?sign=1739220778-YFEkI2TE8S6GFTli9kfLQp9Q2oQ4RZnG-0-6ffcc9edccdf9b70b8509ed7db625b2f)
图1.17 人脸识别
目标分割——目标分割可以识别出图中的物体,并且可以划分出物体的边界,如图1.18所示。
描述图片——把一张图片输入神经网络中,就可以输出对这张图片的文字描述,如图1.19所示。
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_31_1.jpg?sign=1739220778-NI6CmxcOPR2rUF2cQ5cV87cMdlPxSy32-0-2fd48d4c6c89b07c6fc8a087f3eaf26d)
图1.18 目标分割[2]
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_31_2.jpg?sign=1739220778-xP306uyEv4t54Vab6x7EJTt5V2PoqgHQ-0-1ddcd507e1adf6df7af854ad847a2bb2)
图1.19 图片描述
图片风格转换——利用深度学习实现一张图片加上另一张图片的风格,然后生成一张新的图片,如图1.20所示。
语音识别——深度学习还可以用来识别人说的话,把语音数据转换为文本数据,如图1.21所示。
文本分类——使用深度学习对多个文本进行分类,比如判断一个评论是好评还是差评,或者判断一篇新闻是属于娱乐新闻、体育新闻还是科技新闻,如图1.22所示。
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_32_1.jpg?sign=1739220778-AILfFXQaFvuB3vRfNvHxzSVUMdmdqkku-0-5e07646d83a5acc92a9ad491cdfe54b4)
图1.20 图片风格转换[3]
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_32_2.jpg?sign=1739220778-ZfQT6fJEmf5R37A00VWskFRcLrk0e9Zg-0-0aa5d85b7729fd1954e4b0b61b421a4d)
图1.21 语音识别
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_32_3.jpg?sign=1739220778-IVxaXBtlQdYzw0J0mJhsLPOQmf2QfXOe-0-63a2da7c69a59a087d28f4303acc6408)
图1.22 文本分类
机器翻译——使用深度学习进行机器翻译,如图1.23所示。
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_33_1.jpg?sign=1739220778-Jts1G0338cFa1a0HRBuTusnS8g7vrVC1-0-330e1e96541a6d16c2d4e0d57c2d681c)
图1.23 机器翻译
诗词生成——把一个诗词的题目传入神经网络,就可以生成一篇诗词,如图1.24所示,其就是AI写的一首诗。虽然这首诗有些看不太懂,但是已经“有内味了”。
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_33_2.jpg?sign=1739220778-pBODuLRtttsMpK5ateOBheAdEvgPp7yc-0-28854abb61d1037c0ff0f6c49aa06b40)
图1.24 诗词生成
图像生成——深度学习还可以用来生成图片。比如我们可以打开网站https://make.girls.moe/#/,设置好动漫人物的头发颜色、头发长度、眼睛颜色、是否戴帽子等信息就可以生成符合条件的动漫人物,并且可以生成无数张不重复的照片,如图1.25所示。
![](https://epubservercos.yuewen.com/3560BA/20637463908664506/epubprivate/OEBPS/Images/41193_33_3.jpg?sign=1739220778-fMlFqnocmBiZDKUJmUEFvbKkMrHubCow-0-4ac89f254e3a8a3ff765af93ade5ecd5)
图1.25 图像生成
这里只是列举了非常少量的例子,深度学习的已经逐渐深入各行各业,深入我们的生活中。