一本书读懂AIGC:ChatGPT、AI绘画、智能文明与生产力变革
温馨提示:5折以下图书主要为出版社尾货,大部分为全新(有塑封/无塑封),个别图书品相8-9成新、切口有划线标记、光盘等附件不全详细品相说明>>
- ISBN:9787121353932
- 装帧:简裝本
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:240页
- 出版时间:2023-04-01
- 条形码:9787121353932 ; 978-7-121-35393-2
本书特色
适读人群 :AIGC带来的生产力变革与每个人都息息相关,本书适合所有人阅读,特别是文本、图片、音视频等各类内容创作者,以及科技行业、金融行业的从业者和对AI领域感兴趣的读者。1. AIGC是2023年的热点话题,现在已经有很多成熟的应用,ChatGPT是其中比较典型的应用,由此引发了人们对失业问题的担心。本书介绍了AIGC的发展和应用,并且使用了大量的案例,对AIGC是否会让我们失业做出了回应。
2. 本书作为一本科普书,内容全面,语言通俗易懂,介绍了AIGC在各个领域的应用,可以让你全面了解AIGC,在未来可以更好的工作和生活。
3.作者权威,22位AIGC领域专家历时半年编写完成!
内容简介
本书以通俗易懂的方式从各个层面介绍了AIGC的基础知识,并辅以大量案例引领读者了解AIGC的应用实践,让读者可以更快速地利用AIGC改善工作和生活。
第1章从AI发展历史到资本市场近况阐述了AIGC产业的概况,第2章介绍了AIGC相关技术,第3章介绍了文本类AIGC技术的发展及其在传媒、教育、办公等场景中的应用,第4章介绍了声音类AIGC技术的发展及其在音乐、仿真等领域中的应用,第5章介绍了图片类AIGC技术的发展及其在图片生成、图片处理、图片识别等领域中的应用,第6章介绍了视频类AIGC技术的发展及其在视频生成、数字人等领域中的应用,第7章介绍了AIGC上下游产业链(包括芯片、VR等相关设备、元宇宙建模)的概况,第8章提出了AIGC对人类文明发展产生的影响,并对普通人如何应对AIGC带来的“生产力爆炸”提出方法论。
目录
第1章 我们为什么要关注AIGC
1.1 从人工智能到人工智能生成内容
1.2 巨头如是说
1.3 资本狂潮
1.4 异军突起的独角兽企业
1.4.1 OpenAI
1.4.2 Stability AI
1.4.3 Scale AI
第2章 AIGC相关技术介绍
2.1 规则系统
2.2 变分自编码器
2.3 生成对抗网络
2.4 Transformer模型架构
2.5 基于Transformer模型架构的LLM
2.6 扩散模型
2.7 其他模型
2.8 LLM的前景光明
第3章 下笔如有神:文本类AIGC
3.1 何为“智能”
3.2 拆解文本生成技术原理
3.3 文本类AIGC在传媒场景中的应用
3.3.1 社交媒体文案:Jasper
3.3.2 新闻写作:Quakebot、CNET
3.3.3 剧本撰写:海马轻帆
3.4 文本类AIGC在教育场景中的应用
3.4.1 文章撰写:EssayGenuis
3.4.2 出题和做题:高校联合团队开发的AI程序
3.4.3 青少年教育:Cognii
3.5 文本类AIGC在办公场景中的应用
3.5.1 搜索引擎优化:Kafkai
3.5.2 营销文案:Copysmith
3.5.3 电子邮件:Compose.ai
3.5.4 代码撰写:GitHub Copilot
3.6 文本类AIGC的其他热门场景
3.6.1 AI聊天机器人
3.6.2 AIGC搜索引擎:Perplexity AI
3.7 万众瞩目的ChatGPT
3.7.1 ChatGPT是什么
3.7.2 ChatGPT的海量应用场景
3.7.3 GPT-4模型:截至2023年3月*强的AI模型
3.7.4 ChatGPT对普通人意味着什么
3.8 文本类AIGC的未来
第4章 “声临其境”:声音类AIGC
4.1 从让机器开口说话开始
4.2 音乐类AIGC
4.2.1 从留声机到个人计算机制作的电子音乐
4.2.2 早期的音乐类AIGC
4.2.3 端到端模型大展身手
4.2.4 歌声合成
4.2.5 音频延续
4.3 人声类AIGC
4.3.1 变声器
4.3.2 语音助手
4.3.3 有声内容创作
4.3.4 智能电话机器人
4.3.5 教育
4.3.6 无障碍沟通
4.4 声音类AIGC的未来
第5章 如你所见:图片类AIGC
5.1 从计算机艺术到算法模型艺术
5.2 AI绘画
5.2.1 主流的AI绘画工具介绍
5.2.2 生成图片类AIGC的方式
5.2.3 Prompt词组
5.3 图片处理
5.3.1 AI修图
5.3.2 图片增强
5.3.3 分割抠图
5.4 图片类AIGC的衍生应用:AI识图和AI鉴图
5.4.1 人脸和人体识别
5.4.2 通用图片识别
5.4.3 是否由AI绘画工具创作
5.5 实用、有趣的图片世界
5.5.1 头像生成
5.5.2 模拟场景
5.5.3 PPT生成
5.5.4 设计
5.5.5 稿件配图
5.5.6 更多场景
5.6 图片类AIGC的未来
第6章 众所周知,视频是不能PS的:视频类AIGC
6.1 视频生成技术的发展历程
6.2 视频生成工具
6.2.1 数字人视频生成工具
6.2.2 视频编辑工具
6.2.3 文本生成视频工具
6.3 视频生成应用
6.3.1 高清内容生成
6.3.2 快速拆条和视频摘要生成
6.3.3 场景植入
6.3.4 视频卡通化
6.3.5 文本生成视频
6.3.6 数字人视频生成
6.3.7 人脸视频生成
6.4 数字人:仿生人与电子羊
6.5 视频类AIGC的未来
第7章 AIGC的相关产业和生态发展
7.1 芯片:算力决定智力
7.1.1 在AIGC领域中,现在用什么芯片
7.1.2 随着AIGC的发展,对芯片会有什么新的需求
7.2 AIGC展示端口:AR/VR/MR/XR设备
7.3 模型类AIGC应用在元宇宙里自动化建模
7.4 AIGC应用的未来
第8章 AI文明的降临已开启倒计时
8.1 何谓内容
8.2 AIGC的版权争议
8.3 普通人的AIGC时代生存建议
8.3.1 生产力工具:“人工”+“智能”=*强“打工人”
8.3.2 做AIGC应用的老师,为人类的“群体智慧”做贡献
8.3.3 向AIGC应用学习逻辑,同时关注创新
节选
3.7 万众瞩目的ChatGPT
3.7.1 ChatGPT是什么
相信大家都听说过现在火热的ChatGPT。有人甚至说ChatGPT的面世让元宇宙提前10年到来。ChatGPT到底是什么?OpenAI的官网介绍如下:
ChatGPT是一种可以用对话形式交互的AI语言模型。ChatGPT能回答符合上下文语义的多次提问,能认识到自己在对话过程中的不足,能纠正不正确的前提假设甚至拒绝不合理的要求。
ChatGPT这个拗口的名字来源于其背后的模型:GPT模型。截至2023年3月,GPT模型已经发布到了第4代。GPT模型由AI专家团队使用RLHF策略训练而成。训练的方式是大数据学习和人工反馈。OpenAI官网介绍,AI训练员提供对话框架后,在对话中既扮演用户,又扮演AI 助手。AI训练员可以访问模型,对AI助手回复的答案进行优化。同时,AI训练员把新的对话数据集与之前的存量数据集混合,将其转换为对话格式。在海量的大数据训练之后,ChatGPT能用大家熟悉的沟通方式进行互动,生成新的内容而不是重复使用现有的内容。
让中国用户惊喜的是,ChatGPT不仅支持英语、法语、德语等,还支持汉语。2023年3月14日,OpenAI官方公布的数据显示,汉语的准确率高达80.1%,是准确率*高的亚洲语言,超过了日语(79.9%)和韩语(77.0%)。
3.7.2 ChatGPT的海量应用场景
你可能会问,AI聊天机器人已经应用了多年,ChatGPT和之前的AI聊天机器人有什么区别?其实答案在于高可用性和丰富的落地场景。与之前普通的机械式的AI聊天机器人不同,ChatGPT真正具备了“智能”的特点,能用逻辑思维解决问题,甚至能在学术能力评估测试(Scholastic Assessment Test,SAT)的数学考试中取得710分(满分为800分)。ChatGPT的应用场景如下。
1.快速收集资料,高效检索信息
很多人在工作中都需要快速地收集资料并得出事实性的结论。比如,向ChatGPT发出“请列举历史上市值*高的互联网公司”的指令。ChatGPT很快锁定了公司并且给出了它的估值。
历史上市值*高的互联网公司是美国科技巨头苹果公司。苹果公司在2018年8月成为首家市值突破1万亿美元的公司,随后其市值一度超过2万亿美元。截至2021年9月,苹果公司的市值约为2.2万亿美元,成为全球市值*高的公司之一。
值得一提的是,亚马逊公司在2018年9月曾一度超过苹果公司成为市值*高的公司,但其市值并未持续超过苹果公司。此外,其他在互联网和科技领域具有重要地位的公司,如谷歌的母公司Alphabet、Facebook等也都是市值数千亿美元的巨头企业。
你可能已经注意到了,我们问的是市值*高的公司是哪家公司(苹果公司)。ChatGPT在**段就给出了答案,但是ChatGPT的回答更深入,提到了很多别的互联网巨头,如亚马逊、Facebook等。ChatGPT就像一个优秀的员工,在完成本职工作的同时,做了很多额外的工作,让回答更加全面。
试想一下,在没有ChatGPT的时候,我们需要在传统的搜索引擎上查找资料,在收集完原始数据后,还要进行人工计算和信息处理。这样一问一答的形式,不仅是人们更熟悉的沟通方式,在信息传递上也更高效。其背后的逻辑很简单,我们在提出一个问题的时候,希望得到的是一个答案,而不是上万个搜索结果页。 我们把人们检索信息的历史简单地分为三个阶段:
(1)前搜索引擎时代——书报时代。人们翻阅书籍、报刊,一页一页地查找需要的信息,麻烦且效率低下,而且找到的信息往往不全面。
(2)搜索引擎时代。人们把自己需要查找的信息的关键词输入搜索引擎中,然后根据搜索引擎返回的结果,二次或多次处理信息,*终得到自己想要的信息。
(3)后搜索引擎时代——ChatGPT时代。人们可以直接提问,ChatGPT可以直接给出答案。问题越明确,回答得越具体,越高效,但答案不一定完全准确,需要二次验证。
很有意思的是,ChatGPT有纠正错误的能力。例如,向ChatGPT发出“物理学家莫奈有哪些名作”的指令。ChatGPT在回答问题之前,纠正了问题的一个错误——莫奈并不是物理学家,并给出如下回复。
很抱歉,我认为您可能把名字写错了。因为莫奈(Monet)通常是指印象派艺术家克劳德·莫奈(Claude Monet),而不是物理学家。
如果您想了解莫奈的作品,请看以下列表:
-《草地上的午餐》(Luncheon on the Grass)
-《印象·日出》(Impression, Sunrise)
-《鲁昂的大教堂》(Rouen Cathedral)
-《海港》(The Port)
-《鲜花和水果》(Fruit and Flowers)
2.创意文案生成
这可能是所有创意工作者的福音,因为ChatGPT可以做很多有创意性的工作。例如,向ChatGPT发出“与ChatGPT相关的爆款短视频选题有什么”的指令。ChatGPT快速给出了8个选题。不得不说,有几个选题还真让人拍案称绝。
作为一个AI语言模型,我的性质决定了我不是一个可视化的对象,因此不太适合作为短视频选题。不过,以下是一些和我相关的可能会在抖音或其他社交平台上受欢迎的短视频选题的例子:
ChatGPT是什么?一个对话式AI语言模型的简介和介绍。
ChatGPT的技术原理和工作流程,可以通过动画或演示图表的方式呈现。
ChatGPT的使用场景和应用,可以通过场景模拟或用户体验展示。
ChatGPT与人类对话的实时演示,可以通过模拟对话或录制实际对话的方式展示。 这些选题可以让用户更好地了解ChatGPT,吸引关注和讨论。 3.书写高质量的代码
即使你不会写代码,也没有关系,ChatGPT可以帮你实现这个梦想。以*常用的结构化查询语言(Structured Query Language,SQL)为例,向ChatGPT发出“请写一段SQL语句,查找各部门分数*高的3个员工”的指令。ChatGPT先快速地创建了两张表格,一张是员工表(员工ID、员工姓名、部门ID和员工分数),另一张是部门表(部门ID和部门名字)。
employees (id, name, department_id, score)
departments (id, name) 然后,ChatGPT就开始输出以下代码。
SELECT e.name, e.score, d.name AS department_name
FROM employees e
JOIN departments d ON e.department_id = d.id
WHERE ( SELECT COUNT(*) FROM employees e2 WHERE e2.department_id = e.department_id AND e2.score > e.score
) < 3
ORDER BY d.name, e.score DESC; *后,ChatGPT还担心用户看不懂这段SQL语句,用中文做了一下解释。
该查询使用子查询来计算每个员工的部门中有多少个员工比他们的分数高,然后筛选出前三个。*终的结果按部门名称和员工分数降序排列。
如果你懂编程,那么可能会觉得上面的例子过于简单。不过,你可别小瞧了ChatGPT写代码的功力,ChatGPT的编程能力虽然与一线互联网“大厂”的程序员相比还有差距,但是已经超过了很多普通的程序员。
4.逻辑性预判和回答
在图3-20中有很多气球通过绳子拴在地面的重物上。向ChatGPT发出“What would happen if the strings were cut?”(如果把绳子剪断会发生什么?)的指令,ChatGPT准确地给出了结论“The balloons would fly away.”(气球会飞走)。从这个回答中可以看出,ChatGPT不仅可以读懂图片的内容,还能像人一样,结合生活常识对未发生的事情预判结果。
作者简介
贾雪丽
上海技术交易所专家库专家,代尔夫特理工大学硕士,先后就职于 ING 银行、中国平安、光大集团等顶级金融科技企业,拥有丰富的人工智能、隐私计算及区块链等项目经验,申请人工智能相关发明专利 60 余项,在INTERSPEECH会议上发表论文一篇,参与撰写多个隐私计算行业报告和白皮书。 0xAres
利物浦大学硕士,曾先在投资公司工作,后就职于知名公链。从业期间主持制作过多个区块链系列课程,举办过多次“黑客松”,长期致力于区块链的科普教育,有Web3.0行业全领域孵化经验,乐于通过多种形式的内容创作传播Web3.0共识;2021年组建去创作者中心化组织a15a并开始编写新科技领域的科普书籍,主编了《一本书读懂Web3.0:区块链、NFT、元宇宙和DAO》和《一本书读懂NFT:区块链通证、元宇宙资产、Web3.0营销和数字化身份》。 张炯
星图比特创始人兼CEO,中国通信工业协会信息化科技创新专业委员会委员,上海技术交易所专家库专家;曾就职于IBM,拥有丰富的金融科技从业经验,长期服务中国人民银行、中国工商银行等大型金融机构,擅长技术融合、产业创新,对以区块链、人工智能为代表的数字经济技术有深刻的理解;拥有人工智能和数字资产相关专利8项,参与撰写了《一本书读懂Web3.0:区块链、NFT、元宇宙和DAO》和《一本书读懂NFT:区块链通证、元宇宙资产、Web3.0营销和数字化身份》。 a15a
a15a是一个Creator DAO(创作者去中心化组织),致力于以DAO的形式来产出新科技领域的内容,降低普通人了解科技的门槛。a15a已出版多本新科技科普书籍,并计划推出更多体系化课程和讲座。a15a的主要成员是区块链和人工智能领域的专家、从业者、研究人员和学生,以及法律合规领域的专业人士。在抖音、知乎、小红书、推特等平台上搜索“a15a”即可找到a15a官方账号。
-
乡村振兴新技术:新时代农村短视频编辑技术基础入门
¥12.8¥32.0 -
AI绘画+AI摄影+AI短视频从入门到精通
¥45.5¥79.8 -
企业AI之旅
¥43.5¥79.0 -
机器学习
¥59.4¥108.0 -
基于知识蒸馏的图像去雾技术
¥61.6¥88.0 -
软件设计的哲学(第2版)
¥51.0¥69.8 -
智能算法优化及其应用
¥52.4¥68.0 -
Photoshop图像处理
¥25.5¥49.0 -
R语言医学数据分析实践
¥72.3¥99.0 -
大模型推荐系统:算法原理、代码实战与案例分析
¥62.3¥89.0 -
剪映 从入门到精通
¥25.7¥59.8 -
游戏造梦师----游戏场景开发与设计
¥67.6¥98.0 -
SAR图像处理与检测
¥35.4¥49.8 -
人工智能
¥29.4¥42.0 -
中文版PHOTOSHOP 2024+AI修图入门教程
¥59.3¥79.0 -
WPS办公软件应用
¥25.2¥36.0 -
格拉斯曼流行学习及其在图像集分类中的应用
¥13.7¥28.0 -
轻松上手AIGC:如何更好地向CHATGPT提问
¥40.3¥62.0 -
元宇宙的理想与现实:数字科技大成的赋能与治理逻辑
¥61.6¥88.0 -
云原生安全:攻防与运营实战
¥66.8¥89.0