生命科学20年突破性技术纵览:从进化到颠覆,破译生命密码
基于生存的需要和对生命的好奇,人类自诞生以来便开启了对生命奥秘的探索之旅。起初,人们多是观察和描述大自然,典型如古希腊哲学家亚里士多德在两千多年前就对各种动植物进行分类;进一步则是“格物而致知”,基于对自然界持久、多维度的观察,人们开始尝试分析、总结其中的规律,比如英国科学家达尔文在 1859 年提出生物进化理论;而至为关键的转折发生在 1866 年,奥地利生物学家孟德尔利用 3 万多株豌豆,提出遗传学规律,为现代遗传学奠定了重要基础。自此,人们不再满足于博物观察和规律总结,开始对生命的本质和遗传的奥秘展开孜孜不倦的探索追求。
1953 年,詹姆斯·沃森(James Watson)和弗朗西斯·克里克(Francis Crick)在《自然》上发表“DNA 双螺旋结构”,这一具有划时代意义的成果开启了生命科学全新的发展阶段,分子生物学的研究呈井喷之势。数十年后,在以科技、创新为使命的北京中关村,一座名为“生命”的 DNA 双螺旋结构金色雕塑成为地标建筑,寓意着生命科学生生不息。
发展至今,生命科学除了满足人类的好奇心,回答生命过程的机理问题,也“飞入寻常百姓家”。人们日常生活中包括饮食起居在内的方方面面,都与生命科学息息相关。粮食、生物能源、生态环境等一系列领域,也都离不开生命科学技术。
同时,随着生活水平的不断提高,“仓廪实而知礼节”,人们不再仅仅追求三餐饭饱,更是对生活质量提出了高要求:护肤界的成分党崛起,有机食品加入饮食界,健身行业根据需求开展“有氧”和“无氧”训练……科学、健康的生活理念正在“润物细无声”地改变着现代人。
意料之外的疫情在全球肆虐,更是促进了人们对于健康生活的追求。多少人怀念曾经不戴口罩的生活,疫情之前再平常不过的日子似乎成了一种奢求,人们对“健康是一种自由”有了更加深刻的理解。如何治愈疾病?如何健康生活?一切的答案兜兜转转,又回到了问题的源头——生命。
图|2001 - 2021 年“全球十大突破性技术”领域分布
21 世纪是属于生命科学的世纪。短短 20 年间,一大批生命科学相关的基础研究和先进技术在多个领域突飞猛进。《麻省理工科技评论》在过去 20 年里评选出的 200 项全球突破性技术中,与生命科学相关的技术就多达 52 项 ,超 25% 的比例令人惊叹。
细分领域技术蓬勃发展
从入选技术所涉领域可以看到,丰富多样的应用场景已让生命科学技术演化出多个分支。从 21 世纪初开始,带着对生命本质的想象,生物体从整体被逐级放大到组织层面、细胞层面,再到分子层面。人们围绕生物大分子如糖、代谢物、蛋白、基因等展开全面的研究。
首先,分析各类生物大分子的独立组学技术迅速建立,如糖组学、代谢组学、蛋白组学、基因组学等。除去各自独立领域的发展,不同生物大分子之间的相互作用和整体研究也促进了比较相互作用组学、单细胞分析等先进技术的建立。如此多管齐下,生物大分子在生命活动中发挥的独立和联合重要作用得以体现,为多种疾病的诊断和预判奠定基础。
组学之中,基因组学异军突起。DNA 测序技术的迭代发展帮助人们充分了解庞大的基因组序列。基因组的结构、功能、进化、定位和编辑等不断被表征。由此衍生的个人基因组学、100 美元基因组测序、单细胞测序、癌症基因组学等多个技术,实现了人们快速、高效且低成本地诊断潜在疾病的可能性,“私人订制”的医疗措施走进大众视野。针对突发疫情,除了测序技术助力,生命科学的多个领域也迅速响应,如上文所述,2021 年的 mRNA 疫苗技术和 2022 年的新冠口服药出现,从预防到治疗,让病毒无所遁形。除此之外,2022 年取得突破性进展的疟疾疫苗也让人们看到了战胜疟疾等寄生虫传染病的光明未来。
此外,得益于多个组学技术对各类疾病的分析,人们也开始寻找解决各类疾病的根本方法。例如,基因组编辑和基因疗法 2.0 技术让本就源于基因的疾病(地中海贫血症和镰刀型细胞贫血症等罕见病)在源头得以解决;面对传染病(如新冠肺炎和疟疾等),除了控制传染源,未来也不妨尝试从基因层面提高人体免疫力实现传染病的预防;癌症及更为普遍的常见病,相关的基因治疗实验也在马不停蹄地进行着。
需求推动技术革命升温
全球市场中,生命科学领域也备受资本青睐。如合成生物学截止到 2021 年年底相关市场规模达到 737 亿美元,广泛应用于医疗、化工、食品和农业等领域;微流控生物芯片在基因测序、药物筛选和即时检测等领域大放异彩等。
图|2022 年“全球十大突破性技术”领域分布
过去几年,疫情在全球范围内对各个国家、各个产业,乃至个人都产生了不同程度的影响。从“全球十大突破性技术”的评选结果来看,与新冠肺炎疫情相关的生物医药技术也成为近两年生命科学领域的主角。2021 年,mRNA 疫苗入选“全球十大突破性技术”;而在 2022 年入选的 10 项技术中,生命科学领域就有 4 项技术上榜,包括“新冠口服药”“AI 蛋白质折叠”“疟疾疫苗”“新冠变异追踪”,与新冠肺炎疫情相关的有 2 项。
其中,mRNA 疫苗在疫情出现不到一年的时间里得到快速发展,它通过临床试验,在 2021 年获得美国 FDA(食品药品监督管理局)授权的紧急使用许可(EUA),随后正式获批。截至目前,BioNTech、莫德纳等企业的 mRNA 疫苗针已在全球疫情防控中发挥着重要作用 。
新冠口服药的出现也给新冠患者的治疗带来了福音。毫无疑问,针对新冠肺炎疫情的防控手段与药物创新,正是当下以及未来生命科学领域的研究重点,我们也必将看到越来越多与疫情防治相关的技术和药物推出。
政策助力产业腾飞
目前,全球已有多个国家将生命科学技术作为国家战略性技术储备。在 21 世纪初,美国、俄罗斯、日本等发达国家都制定相关的科技计划。虽然各国发展规划各异,但可以看到,各国都极为重视生命科学的发展。
生命科学在我国也受到前所未有的重视。事实上,早在 2009 年,国务院就颁布了《促进生物产业加快发展的若干政策》,对发展生物技术药物、生物医学材料等做出指导。到了 2016 年,发展生命科学技术被写进了《“十三五”国家战略性新兴产业发展规划》,之后,科学技术部(简称科技部)、国家发展和改革委员会(简称国家发改委)、财政部等多个部门相继发布多个文件,从多个维度助推我国生命科学产业的发展。
图|中国生命科学领域重要文件
对于生命科学技术发展而言,21 世纪无疑是一个最好的时代,诸多技术将在对应的应用场景中大放异彩。在过去的 20 年里,这一事实在多个细分技术领域中已经得到验证了,细胞和基因疗法(Cellular and Gene Therapy,CGT)、免疫-疫苗、生物制药-肿瘤药、脑科学-神经科学、合成生物学等无一例外地成为资本市场的宠儿,且已经呈现出巨大的应用潜力和可观的市场前景。
细胞和基因疗法不断突破,前景可期
细胞和基因疗法(CGT)是当下最被看好的抗癌新手段。该疗法将确定的遗传物质转移至患者的特定靶细胞内,通过基因添加、基因修正、基因沉默等方式修饰个体基因的表达或修复异常基因;又或利用患者自体或异体的成体细胞或干细胞,通过获取、分离、培养扩增、筛选等一系列生物工程技术手段处理之后,将其回输到患者体内进而对组织、器官进行修复,从而达到治愈疾病的目的。
相比传统肿瘤治疗手段,如手术治疗、放射治疗、化学药物治疗等,以基因技术和细胞技术为基础的 CGT 更具针对性,不仅能获得较为理想的治疗效果,还能大大减轻患者在治疗过程中的痛苦,其发展前景被市场广泛看好。
细胞疗法大体可分为干细胞疗法和免疫细胞疗法。干细胞疗法的临床数据较丰富。近几年,全球每年新增的干细胞临床研究数量稳定在 400 项左右,其中我国每年临床研究数量稳步增加,占全球干细胞临床研究的比例不断提高。其中近 7 成临床研究中所使用的干细胞来源于骨髓、外周血和脐带的造血干细胞及间充质干细胞。
图|全球干细胞临床研究数量(截至 2019 年 2 月)
图|全球免疫细胞临床研究数量(截至 2019 年 2 月)
从临床数据看,美国远远领先于其他国家和地区,欧盟和中国仅次于美国。此外,加拿大、韩国、日本等国家的临床研究也比较活跃。
另一方面,免疫细胞疗法的临床数据也表现出明显的增幅。
嵌合抗原受体 T 细胞(Chimeric Antigen Receptor T-cell,CAR-T)疗法采用基因编辑的方法将 T 细胞改造成 CAR-T,把 CAR-T 注入患者体内,通过免疫作用高效杀灭具有相应特异性抗原的肿瘤细胞,从而达到治疗恶性肿瘤的目的。
近几年,CAR-T 疗法通过不断优化改良,已在临床肿瘤治疗中显示出良好的靶向性、杀伤性和持久性,是一种精准、快速、高效,且有可能治愈癌症的新型细胞疗法,展示了较大的发展潜力和较广的应用前景。
如今,随着以 CAR-T 疗法、T 细胞受体工程化 T 细胞(T Cell Receptor-Engineered T Cell,TCR-T)疗法为代表的免疫细胞疗法的兴起,临床研究数量逐步攀升,特别是 CAR-T 疗法临床研究更是以接近 40% 的年平均增长率呈井喷式爆发趋势。以 CAR-T 疗法、TCR-T 疗法、肿瘤浸润淋巴细胞(Tumor Infiltrating Lymphocytes,TIL)疗法和自体细胞免疫(Cytokine-Induced Killer,CIK)疗法这 4 种常见的免疫细胞疗法为例,美国和中国的临床研究规模远超过其他国家和地区,呈现 “双雄争霸” 的格局。其中,中美两国开展的免疫细胞临床研究均以 CAR-T 为主,且中国开展的 CAR-T 产品临床试验数量为全球第一。
发展过程中,载体递送技术、基因编辑技术、CAR-T 技术等都实现了迭代创新。其中,CGT 治疗领域最热门的技术之一:规律成簇的间隔短回文重复(Clustered Regularly Interspaced Short Palindromic Repeats,CRISPR)基因编辑技术,更是让基因编辑步入了爆发式发展阶段。该项技术的发明者——法国科学家埃马纽埃尔·沙彭蒂耶(Emmanuelle Charpentier)和美国科学家珍妮弗·A. 杜德纳(Jennifer A. Doudna)在 2020 年获得诺贝尔化学奖。
技术的发展成熟推动 CGT 应用的进一步普及。目前来看,CGT 的适应证覆盖比例在不断提升,市场需求也在快速增长。L.E.K. 数据显示,2016 年 - 2020 年,接受 CGT 的患者数量的复合年均增长率为 35%~40%;预计 2020 年 - 2025 年的复合年均增长率最高或达 25%。
图|全球 CGT 市场规模增长趋势
CB Insights 预测,到 2025 年,全球 CGT 市场规模可达 290 亿美元,复合年均增长率约为 19.70%。
截至 2021 年 2 月,CGT 适应症已经覆盖肿瘤科、眼科、血液科、炎症及自身免疫疾病、神经系统、心血管等领域,且比例在不断提升。其中,覆盖比例最高的为肿瘤科,高达 39%。
图|全球 CGT 适应症覆盖比例和全球 CGT 产品临床实验阶段比例统计
CGT 行业也在加速产出。截至目前,全球各国已有多个 CGT 产品获批使用,包括 CAR-T 疗法、干细胞疗法和腺病毒基因疗法等。此外,从全球 CGT 产品的临床阶段分布情况来看,截至 2021 年 2 月,处于临床 1 期的产品占比最大,为 55%,其次为临床 2 期产品,占比 36%,临床 3 期产品占比 9%。
自 2015 年开始,我国 CGT 的临床试验数量也呈现爆发式增长。根据咨询公司弗若斯特沙利文(Frost & Sullivan,后文简称沙利文)的数据,在 2015 年到 2020 年间,我国累计开展了约 250 项 CGT 临床试验,数量仅次于美国;复合年均增长率超过 60%,位列全球第一。
中国 CGT 产业虽然发展时间较短,但在技术创新和政策扶持的背景下,相关成果也在陆续出现。截至目前,我国已先后发布了多个与发展基因治疗、细胞治疗相关的政策。
图|国内 CGT 相关政策
其中,2016 年国务院发布的《“十三五”国家科技创新规划》和 2017 年国家发改委发布的《“十三五”生物产业发展规划》都对基因治疗领域的产业发展给出了激励政策。最近的一项政策是 2022 年 5 月国家发展改革委发布的《“十四五”生物经济发展规划》,其中明确指出要重点发展基因诊疗、干细胞治疗、免疫细胞治疗等新技术。
可观的发展前景叠加政策“红利”,也让 CGT 成为资本市场的宠儿,自 2015 年以来,行业内融资并购事件频繁。根据 L.E.K. 的统计数据,CGT 行业融资与并购规模从 2017 年约 80 亿美元增长到 2020 年约 200 亿美元。
CGT 在海外已经发展、应用多年,并涌出了不少具有代表性的头部公司,如诺华(Novartis)集团、罗氏(Roche)公司等。其中,诺华集团成立于 1996 年,该公司重点开发、转化的是 CGT 的3个领域:基于腺相关病毒(Adeno-Associated Virtus, AAV)的疗法、CAR-T 疗法和基于 CRISPR 的技术。从数据来看,诺华集团 CGT 产品的年收入自 2019 年以来迅猛增长,从 2018 年的 7600 万美元增长到 2019 年的 6.39 亿美元,在 2020 年更是实现了 13.94 亿美元的年收入;2018 年 - 2020 年的复合年均增长率高达 328%。
在国内,CGT 领域也已吸引多方布局,投资、融资活跃。根据沙利文报告,中国 CGT 领域风险投资、融资金额在 2020 年达到 38.6 亿美元,较 2019 年的 25.86 亿美元增长约 50%。
细胞和基因治疗公司也备受资本青睐,其中,上市公司药明巨诺在 2018 年 - 2020 年,连续 3 年进行了 3 轮融资。在登陆港股市场之前,药明巨诺前后完成融资共计约 2.84 亿美元;生物制药公司科济生物在 IPO(首次公开发行)前总融资也超过 2.8 亿美元。
肿瘤靶向药发展迅猛
受环境恶化、社会压力、不良生活方式的影响,全球范围内肿瘤患者的数量在快速增加。
一方面,肿瘤新发患者数量日益增长,癌症类型日益繁杂;另一方面,传统的肿瘤治疗方法又存在诸多局限。因此,肿瘤治疗领域亟需“新鲜血液”。随着基因测序、基因编辑等技术的发展,肿瘤靶向治疗也成为医疗科学领域备受关注的新型疗法之一。
所谓肿瘤靶向治疗,是指在细胞分子水平上,针对已经明确的致癌位点(蛋白分子或基因片段)设计相应的治疗药物,使其进入体内后与致癌位点结合而起作用。肿瘤靶向治疗因其精准度高、毒性低,成为被广泛看好的抗癌新疗法之一,而靶向药物也迎来迅猛发展。
图|2013 - 2021 年全球肿瘤免疫治疗行业融资总额和交易数量
CB Insights 数据显示,自 2013 年来,肿瘤免疫治疗领域融资总额与交易数量呈上升趋势,分别在 2015 年和 2018 年达到阶段性峰值,与之相对应的便是两款重磅药物 —— PD-1 和 CAR-T 的获批。
靶向药物具有特异性高、毒副作用较小等优势特性,对多种恶性肿瘤具有显著疗效,被认为是最有希望“攻克”癌症的药物,在近几年也成为抗肿瘤新药的主流。IQVIA 数据预测,到 2025 年,肿瘤免疫治疗药物支出预计将超过 500 亿美元。
肿瘤靶向药在海外市场的用药历史已超过 20 年。自 1997 年至 2020 年,美国 FDA 共批准 184 个抗肿瘤药物(不含辅助药物)上市,其中,靶向抗肿瘤药物总体占比约 65%。数据显示,在过去近 20 年里,靶向药物在整个肿瘤药物市场中的占比在逐年提升。2022 年,肿瘤靶向药占比约为 73%。
在我国,肿瘤靶向药也在快速发展,国内新药审批政策、医保政策等方面也给予了大力支持。其中,2020 年 12 月 28 日,国家医疗保障局公布 2020 年国家医保药品目录,其中纳入医保的肿瘤靶向新药达 49 款 。
政策红利和市场需求也吸引了众多中国本土药企相继布局肿瘤药领域。目前,肿瘤药制造上市公司主要有:复星医药、恒瑞医药、益佰制药、贝达药业、君实生物、哈药股份、莱美药业等。
合成生物学大爆发
合成生物学(Synthetic Biology)是当今生物学领域的前沿研究方向,合成生物学技术正在逐步取代传统化学合成成为全球医疗健康、食品饮料、化工、材料等领域“绿色合成”的重要途径。与传统的化学合成相比,合成生物学技术具有原材料可再生、低碳排放、效率较高、环境友好、安全性高等性能优势。
广泛多元的应用场景,给合成生物学带来了巨大的市场空间。同时,多种新技术如物体设计的超高通量筛选平台、酶法 DNA 合成和新型基因编辑的开发也推动着行业加速创新。合成生物学可观的市场前景,也在吸引全球资本入场。
图|2017 - 2024 年全球合成生物学市场规模
CB Insights 数据显示, 2019 年全球合成生物学市场规模达 53 亿美元。预计到 2024 年将达到 189 亿美元。
2010 年以来,合成生物行业进入快速发展期,诸多传统化工和新兴企业均展开了合成生物领域的布局,2015 年后合成生物技术企业全球融资规模不断扩张,统计数据显示,2020 年全球合成生物学融资额高达 78 亿美元。
根据 CB Insights 的统计,2010 年 1 月至 2020 年 8 月,全球合成生物学领域共发生 391 起融资事件,其中 2017 年的融资事件数量为 70 起,是历年来最高,而 2018 年则创下融资金额最高纪录,约为 23 亿美元。
在我国,合成生物学领域在过去几年里也取得了突飞猛进的发展,合成生物学正在成为 ESG(环境、社会和公司治理)投资重点。数据显示,2021 年中国合成生物学市场规模约为 64.16 亿美元,较 2020 增长 39.38 亿美元。
在国家政策带动下,包括北京、上海、江苏等多个省(区、市)在“十四五”规划中都对合成生物学发展提出相关的目标和要求。
元宇宙加持,脑科学迎来百亿市场
在一众前沿科技领域中,脑科学无疑是最尖端也是最具颠覆性的一个,是人类理解自身和整个自然界的“终极疆域”。目前,全球主要经济体都高度重视脑科学的发展,无论是政策层面的激励,还是商业层面的活跃,都反映出脑科学所具有的可观发展前景。
图|大脑健康领域全球市场规模估测
CB Insights 数据显示,2020 年大脑健康市场规模约为 62 亿美元,预计在 2024 年将突破 100 亿美元,2020 年 - 2024 年的复合年均增长率有望达到 17%,从而成为下一个有可能为人类社会带来颠覆性影响的产业。
从全球来看,脑科学领域的融资在过去几年呈上升趋势;2021 年全球有 181 起融资事件,金额高达 67.64 亿美元。2021 年平均每起事件的融资金额约为 3700 万美元。其中,千万美元级的融资事件共有 110 起,是 2020 年的 2 倍,2019 年的 3 倍。中国脑科学领域的融资同样呈上升趋势,2021 年共完成 54 起融资,总额约为 13.2 亿美元。
图|2016 - 2021 年 4 月脑科学创业企业融资情况
从 2016 年 1 月到 2021 年 4 月,全球脑科学创业企业融资数量整体稳定上升:2020 年的融资数量较 2016 年上升了 35% 左右,2020 年融资总额达到 5 年来的峰值,超过 50 亿美元。
从公司阶段分布来看,脑科学领域的创业公司主要为中早期(B 轮及以前)公司。从过去 5 年的数据来看,B 轮的公司份额虽有浮动,但总体在增加;种子轮/天使轮和 A 轮的企业份额略有波动,但在 2020 年触底(共计占比 37%)。这也说明早期成立的脑科学企业正在走向壮大,并且获得资方青睐;也意味着该领域还有巨大发展空间。随着技术的发展和资本的投入,或许产业化将实现井喷式增长。
图|2016 - 2021 年 4 月脑科学创业企业融资数量占比情况
图|2016 - 2021 年 4 月脑科学创业企业阶段分布情况
从公司分布来看,中国位列第二,美国、英国、韩国、瑞士也有一定比例的脑科学创业公司融资动作。从上面的数据总体来看,脑科学的市场潜力巨大,各国的创业企业都在跃跃欲试。
据 CB Insights 最新专利数据统计,Top 5 的脑科学相关专利内容分别是:神经系统疾病、神经生理学、神经病学诊断、神经外伤、神经科学。
从脑科学研究的落地模式来看,首要的应用领域,必然聚焦在维持健康的大脑发育及智力发育,脑机接口在元宇宙概念的推动下,成为具有发展潜力的领域之一。脑机接口是指在人或动物大脑与外部设备之间创建的直接连接,从而实现脑与设备的信息交换。近两年,在元宇宙概念热潮带动之下,脑机接口也备受市场关注。
以埃隆·马斯克(Elon Musk)为代表的一众科技商人,在脑机接口领域布局积极。在他们看来,脑机接口是未来进入元宇宙的路径,将带来比 AR、VR 更为革命性的体验。数据显示,全球脑机接口市场规模在 2019 年达到了 13.6 亿美元,预计 2027 年可达到 38.5 亿美元,复合年均增长率约为 14.3%。
作为重要的前沿技术领域,脑科学的发展在我国也受到高度重视。“中国脑计划”(CBP)在 2016 年正式启动,该计划旨在探索大脑秘密、攻克大脑疾病、开展类脑研究。“十三五”期间,北京和上海成立了北京脑科学与类脑研究中心、上海脑科学与类脑研究中心,目前均已启动“脑科学与类脑智能”地区性计划,开始资助相关研究项目。
2021 年,在“十四五”规划纲要中也明确提出瞄准生命健康、脑科学等领域,实施一批具有前瞻性、战略性的国家重大科技项目。根据《中华人民共和国国民经济和社会发展第十四个五年规划和 2035 年远景目标纲要》,“十四五”期间,我国脑科学与类脑研究将围绕脑认知原理解析、脑介观神经联接图谱绘制、脑重大疾病机理与干预研究等 5 项重点展开。
mRNA 技术的远大前程
过去的数年间里,生命科学领域最为受关注的莫过于与新冠肺炎疫情相关的技术和药物,而 mRNA 疫苗便是其中一颗闪闪明星,尤其在海外表现突出。从 2020 年春夏开始,科研领域和药企都不约而同关注起“信使”RNA (mRNA)疫苗,2020 年辉瑞/BioNTech 和莫德纳生产的两款 mRNA 疫苗获批上市。
数据显示,2021 年,辉瑞实现营收约 813 亿美元,同比大涨约 94.01%,该年辉瑞向全球提供了约 22 亿剂 mRNA 疫苗,新冠疫苗为公司带来约 367.8 亿美元的收入,让辉瑞从 2020 年世界药企收入排行榜的第八名,一举跃升到 2021 年的世界第二。
莫德纳公司在 2021 年全年营收约为 184.71 亿美元,同比增长约 2199.12%。该年,莫德纳则为全球提供了约 8.07 亿剂 mRNA 疫苗,带来的收入约为 176.7 亿美元;公司净利润约为 122 亿美元,同比增长约 1733.33%。
事实上,学界对于 mRNA 疫苗的研究早在 1990 年就已经开始。不过,由于 mRNA 的稳定性和递送方面的技术问题,相关研究和临床试验进展并不顺畅,直到近些年,mRNA 疫苗及 mRNA 技术在实际应用领域快速发展。
当然,mRNA 技术并不仅仅用于如新冠疫苗等预防性疫苗,还可用于生产治疗疫苗、治疗药物等。PubMed 预计,治疗疫苗 2035 年市场规模约为 70 亿~100 亿美元;治疗药物 2035 年市场规模约 40 亿~50 亿美元。
除新冠疫苗之外,口服药的出现也为防疫抗疫工作提供了不少助力。2021 年 11 月 4 日,默沙东/Ridgeback 生产的新冠口服药 Molnupiravir 在英国获批上市,这也是全球首个新冠口服药。新冠口服药也在 2022 年被评选为“全球十大突破性技术”之一。
2022 年,国内也迎来首款国产口服新冠药物。根据媒体报道,用于新冠病毒肺炎适应证的阿兹夫定片已于 2022 年 8 月 2 日在河南平顶山市真实生物科技有限公司正式投产。
本文摘录自:《科技之巅(20周年珍藏版):全球突破性技术创新与未来趋势》
在美国Copilot就像教育界的 ChatGPT,正在颠覆整个软件开发行业
2023 年春天,诺亚·吉夫特(Noah Gift)在美国北卡罗来纳州杜克大学教授编码课程两周后,他告诉学生们扔掉他给的课程材料。
学生们将不再学习最流行的入门级编程语言之一 Python,而是学习 Rust,一种更新、更强大、更难学习的语言。
(来源:AI 生成)
吉夫特是一名拥有 25 年经验的软件开发人员,他自己刚刚学会了 Rust。但他相信,他的学生们也会很快适应这个突然的改变。
这是因为他们每人都有一个特殊的新助手:一个名为 Copilot 的人工智能工具,这是一种建立在 OpenAI 最新大语言模型 GPT-3.5 和 GPT-4 之上的计算机代码自动补全和辅助工具。
Copilot 由 GitHub 公司开发。该工具会监测你的每一次按键,预测你想要实现什么,并不断提供接下来有可能出现的代码片段供你使用。
在微软工作的朋友告诉了吉夫特 Copilot 的存在,他立刻看到了它的潜力。
他说:“如果没有 Copilot,我不可能像现在这样快速地学会 Rust。这就像我身边有一个超级智能助理,当我试图提升自我时,他可以回答我的问题。很明显,我们应该在课堂上开始使用它。”
吉夫特并不孤单。如果你问一屋子计算机科学专业的学生或程序员是否用过 Copilot,许多人都会举手。本文采访的所有人都说他们自己使用了 Copilot,甚至那些指出该工具存在问题的人也是如此。
就像教育领域的 ChatGPT 一样,Copilot 正在颠覆整个软件开发行业,为人们提供新的方式来完成旧任务。Copilot 是微软 Visual Studio 里的付费插件,但它并不是程序员唯一可用的工具。
2023 年 8 月,Meta 发布了一个名为 Code Llama 的免费代码生成模型,该模型基于 Meta 的 Llama 2 大模型,对标 GPT-4 的产物。
同月,图像生成模型 Stable Diffusion 背后的公司 Stability AI 发布了 StableCode。当然,还有 ChatGPT,OpenAI 从一开始就将其定位为一种聊天机器人,可以帮助编写和调试代码。
Meta Code Llama 团队负责人加百列·辛纳耶夫(Gabriel Synnaeve)表示:“这是机器学习模型第一次对很多人真正有用。它不是华而不实的东西,而是真的很有用。”
随着微软和谷歌即将在全球数十亿人使用的办公软件中引入类似的生成式模型(微软已经开始在 office 365 中使用 Copilot 作为品牌名称),值得一问的是,这些工具到底为程序员做了什么。
它们是如何改变一份已有几十年历史的工作的基础的?它们会帮助程序员创造更多更好的软件吗?还是会让他们陷入知识产权和版权的法律纠纷?
启动代码
从表面上看,编写代码需要在文本文件中键入某些编程语言的语句和指令。然后,它被编译成计算机可以执行的机器代码。
在实践中,程序员也会花很多时间在网上搜索,寻找常见问题的解决方法,或者浏览在线论坛,寻找更快的算法编写方法。许多写好的现有代码块会被重新调整用途,新软件通常就这样拼接、组合在一起。
但 GitHub 的 CEO 托马斯·多姆克(Thomas Dohmke)表示,查找资料需要时间,让程序员无法迅速将思想转化为代码:“你打开了很多网页,你正在计划度假,也许你正在阅读新闻。
最后你复制了所需的代码,回到你写的那里,但已经过去了 20 分钟,你已经不在状态了。”
Copilot 和其他类似程序(有时称为代码助手)背后的关键思想是,将程序员需要的信息放在他们正在编写的代码旁边。
该工具可以追踪程序员正在处理的文件中的代码和注释,以及它链接到的或在同一项目中编辑过的其他文件,并将所有这些文本作为提示发送到 Copilot 背后的大型语言模型中。
GitHub 与 OpenAI 共同开发了 Copilot 所用的模型 Codex。这是一个对代码进行了微调的大型语言模型。Copilot 可以预测程序员试图做什么,并给出代码建议。
这种代码和 Codex 之间的“交流”每秒发生多次,提示会随着程序员的键入而更新。在任何时候,程序员都可以通过点击 tab 键接受 Copilot 的建议,或者忽略它继续输入。
按钮似乎经常被点击。GitHub 和咨询公司 Keystone Strategy 在 2023 年 6 月发布的一项针对近 100 万 Copilot 用户的研究发现,根据 GitHub 的用户数据,程序员平均接受了约 30% 的建议。
多姆克说:“在过去的一年里,Copilot 提出了超过 10 亿行的代码,并获得了开发人员的同意。现在,在计算机内部运行的是随机生成的代码。”
Copilot 改变了编码的基本技能。与 ChatGPT 或 Stable Diffusion 等生成式工具一样,该工具的输出通常并不完全符合要求,但可能很接近。
加拿大蒙特利尔理工学院的研究员阿尔哈万·莫拉迪·达赫尔(Arghavan Moradi Dakhel)主要研究机器学习工具在软件开发中的使用,他说:“也许它给出的东西是正确的,也许不是,但那是一个好的开始。
编程变得“提示化”。这项工作不再是从零开始编写代码,而是调整不太完美的代码,并推动一个大型语言模型来产生更符合需求的东西。
但 Copilot 还没有广泛普及。包括苹果在内的一些公司要求员工不要使用它,以免将 IP 和其他私密数据泄露给竞争对手。
Merly是一家使用人工智能分析大型软件项目代码的初创公司,其 CEO 贾斯汀·戈特施利希(Justin Gottschlich)认为,这一点将永远是一个硬伤:“如果我是谷歌或英特尔,我的 IP 是我的源代码,那么我永远不会使用 Copilot。”
他补充说:“我为什么不把我所有的商业秘密也发给你呢?这就像下雨要打伞一样明显。”
多姆克意识到这对关键客户来说是一个障碍,并表示该公司正在开发一种企业可以在内部运行的 Copilot 版本,这样代码就不会发送到微软的服务器上。
Copilot 也可能被程序员视作诉讼对象,他们对自己的代码在未经他们同意的情况下被用来训练其背后的模型感到不满。微软已向潜在可能提起诉讼的用户提供赔偿。但法律问题需要数年时间才能在法庭上解决。
多姆克非常乐观,他相信利大于弊:“我们将适应美国、英国或欧洲立法者告诉我们的任何事情。但在保护权利和隐私,以及我们人类向前迈出一步之间,存在着一种折衷的平衡。”
这确实像是从 CEO 口中说出的话。但这是一个新的、未知的领域。如果不出意外的话,GitHub 正在领导一项大胆的实验,该实验可能为更广泛的人工智能专业助手铺平道路。
第一个迹象是,他们把用来面试的编程题交给了编程工具:“这是一些代码,你要完成它。”GitHub 将这些代码交给了 Copilot 工具的早期版本,并让它在每个测试上尝试 150 次。
150 次尝试之后,他们发现该工具可以解决 92% 的问题。他们再次尝试了从 GitHub 在线平台上提取的 50000 个问题,该工具解决了其中的一半以上。多姆克说:“这给了我们信心,我们可以创造出 Copilot。”
2023 年,一个由 GitHub 和微软研究人员组成的团队,在一项小规模研究中测试了 Copilot 对程序员的影响。
他们要求 95 个人构建一个网络服务器,并允许一半的人使用 Copilot。最终,使用 Copilot 的程序员完成任务的速度平均快了55%。
一个强大的人工智能取代了谷歌搜索,我们看到了真实的效果,但它能改变游戏规则吗?人们的意见并不同意。
Keystone Strategy 联合创始人、哈佛商学院教授马可·伊安西蒂(Marco Iansiti)表示:“我认为,这就像你旁边坐着一位经验丰富的开发人员,他在那里不断地给你建议。以前你必须自己查,现在建议自动就发来了。”
但是,多年来一直致力于自动代码生成的戈特施利希对此不太感冒。“坦率地说,代码助手无法实现更大规模的东西。”他说道。他指的是基于大型语言模型的代码工具,如 Copilot。
“他们主要受人类程序员所能做的事情的约束。在现阶段,他们不太可能做出超出人类程序员所做的事情。”
戈特施利希声称,Merly 的技术可以发现代码中的错误并自行修复(但他没有说明这是如何工作的)。而且他正在考虑更大的问题。
他认为人工智能有一天会接管庞大而复杂的代码库的管理,指导人类工程师如何维护它。但他认为大型语言模型不适合这项工作。
即便如此,对数百万人一直在做的任务施加微小的改变,这些改变也会很快累积起来。
例如,伊安西蒂提出了一个夸张的想法:他认为,到 2030 年,Copilot 及其类似工具的影响可能会为全球经济增加 1.5 万亿美元。
他说:“这更多的是一个粗略的估计,不是真正的学术估计,但也可能比这大得多。
有太多的东西取决于软件。如果你对软件开发的真正运作方式有所了解,它将对经济产生无限的影响。”
对于伊安西蒂来说,这不仅仅是让现有开发人员生成更多的代码。他认为,这些工具将增加对程序员的需求,因为公司可以用更少的钱获得更多的代码。
同时,由于这些工具降低了进入门槛,将有更多的程序员出现。他说:“我们将看到谁能为软件开发做出贡献。”
或者,正如 GitHub 的高级研究总监伊丹·加齐特(Idan Gazit)所说:想象一下,如果任何拿起吉他的人都能立即演奏一首简单的曲子,那就会有更多的吉他手和更多的音乐。
正如吉夫特发现的那样,许多人都认为 Copilot 让学习编程变得更容易。
他说:“Rust 以其艰涩而闻名。但我对学生们的表现和他们构建的项目感到惊喜,它们是多么的复杂和有用。”
吉夫特说,他们能够构建包含聊天机器人的完整网页应用程序。
然而,并不是所有人都对吉夫特的教学大纲变化感到满意。他说,他的一名助教告诉新生不要使用 Copilot,因为它是一根拐杖,会阻止他们正常学习。
吉夫特承认 Copilot 就像辅助轮,你可能不愿离开它。但他认为这不是问题:“我们想实现什么?我们正在努力构建复杂的系统。”他认为,要做到这一点,程序员应该使用任何可用的工具。
诚然,在计算的历史上,程序员在自己和计算机可以运行的机器代码之间依赖越来越多的软件层。它们已经从穿孔卡片和汇编语言,发展到相对易于读写的 Python 等编程语言。
多姆克说:“当我在 80 年代和 90 年代开始编码时,你仍然需要知道 CPU 是如何工作的。现在,当你编写网页应用程序时,你几乎从不考虑 CPU 或网页服务器。”
再加上一大堆的 bug 捕获和代码测试工具,程序员已经习惯了大量的自动化支持。从很多方面来说,Copilot 和其他工具只是最新一波进展。
吉夫特说:“我使用 Python 25 年了,因为它是为了让人类可读而创造的。在我看来,这已经不重要了。”
但他指出,Copilot 并不是一个免费通行证。“Copilot 反映了你的能力。”他说,“它让每个人都有了一点提升,但如果你是一个糟糕的程序员,你仍然会有弱点。”
要做的工作
想要评估这些工具的真正影响,一个大问题是,大多数数据仍然稀缺。GitHub 的研究表明,程序员接受了 30% 的建议,但尚不清楚程序员为什么接受这些建议而拒绝其他建议。
同一项研究还表明,经验不足的程序员接受了更多的建议,而且随着他们逐渐习惯该工具,程序员接受了越来越多的建议。但同样,原因也不清楚。
伊安西蒂说:“我们需要更深入地理解这意味着什么。要真正了解编码过程本身是如何发展的,还有很多工作要做,而这一切都有待确定。”
大多数对 Copilot 等工具的独立研究,都集中在它们所建议的代码的正确性上。像所有大型语言模型一样,这些工具可能会产生无意义的结果。
对于代码来说,其是否有意义可能很难判断,尤其是对于经验不足的用户来说,他们似乎也是最依赖 Copilot 的群体。
在过去的几年里,几个研究小组发现,Copilot 会在代码里留下漏洞或安全缺陷。GitHub 则一直忙于提高 Copilot 建议的准确性。
它声称,该工具的最新版本会通过第二个模型运行代码。该模型经过训练,可以在向用户提出建议之前过滤掉常见的安全漏洞。
达赫尔说,但是除了 bug,还有其他质量问题。她和她的同事发现,Copilot 可能会建议过于复杂或不符合最佳实践的代码,这是一个问题,因为复杂或不清楚的代码对其他人来说更难阅读、检查和扩展。
问题是,模型只能和它们的训练数据一样好。Copilot 的模型是在有着 15 年历史的、GitHub 在线存储库中提取的大量代码库上进行训练的。
这些代码不仅包含错误,还包含编写代码时未知的安全缺陷。
达赫尔说,再加上缺乏经验的程序员会比有经验的程序员更多地使用该工具,因此从长远来看,它或许会为软件开发团队带来更多的工作。资深程序员可能不得不花更多的时间仔细检查新手编写的代码。
达赫尔现在希望更全面地研究资深和非资深程序员之间的差距。在 Copilot 发布之前,她和她的同事们正在使用机器学习通过代码来检测程序员的水平。
但 Copilot 把她的数据搞砸了,因为现在很难判断代码是由资深程序员编写的,还是由经验不足的程序员在人工智能的帮助下编写的。
现在,在体验过 Copilot 之后,她计划用自己的方法来研究它能带来什么样的提升。
她说:“我很想知道,使用这种工具的初级开发人员是否会被预测为资深开发人员,或者是否仍然可以检测到他们是初级开发人员。这可能是衡量这些工具给人们带来多大提升的一种方式。”
我们可能不需要等待太久就能看到结果。软件开发是记录最充分、评估最全面的商业活动之一。
如果 Copilot 有效,它就会被使用。如果没有效果,就不会有人用它。与此同时,这些工具正在变得越来越好。
然而值得注意的是,编程只是软件开发整体工作的一小部分。它还涉及到管理复杂项目的多个部分,包括设计代码、测试和部署。
Copilot 和之前的许多程序一样,可以更快地完成部分工作,但它不会完全重塑它。
辛纳耶夫说:“程序员会一直存在。他们会得到很多帮助,但最终重要的是要了解哪些问题需要解决,要真正做好这件事,并将其转化为程序,这才是程序员真正的工作。”
作者简介:威尔·道格拉斯·海文(Will Douglas Heaven)是《麻省理工科技评论》人工智能栏目的高级编辑,他在这里报道新的研究、新兴趋势及其背后的人。此前,他是英国广播公司(BBC)科技与地缘政治网站 Future Now 的创始编辑,也是 New Scientist 杂志的首席技术编辑。他拥有英国伦敦帝国理工学院计算机科学博士学位,深谙与机器人合作的体验。
支持:Ren
相关问答
到目前为止,人类制造了哪些脑洞大开的黑科技?
黑科技到底是什么?黑科技是指远超越现今人类科技或知识所能及的范畴,缺乏科学依据并且违犯自然原理的科学技术或...刷脸支付:比指纹密码更可靠这是一项已经应用...
未来10年,你认为哪些行业将被颠覆?
谈到被颠覆那一定是时代发展趋势中不可逆转的更新迭代!时代发展中不可阻挡的大趋势:智能化的扑面而来;商业民主化的必然发生;区块链将改变一个时代!所以...
你觉得最应该被区块链技术颠覆革命的行业有哪些?为什么?
财务官的发展角色:制定经营战略+与外部市场沟通除了监督财务流程以外,首席财务官还负责确定及落实整体的经营战略。区块链能够通过促进新交易的产生和整...随之...
老表们有谁知道!!山东动力柜生产设备厂家有哪些颠覆行业生产...
[回答]甘肃动力柜生产设备厂家有哪些颠覆行业生产模式山东博凌机械科技有限公司动力柜生产设备可根据客户的不同要求,集成生产所需产品的众多工艺,如自动...
高科技的核心价值,就是去创新吗?就是去颠覆某些落伍的传统行业?
不是为了创新而创新,人的需求就那些,以前由于技术的限制,不能满足的,创造新方式得到满足,以前低效满足的,由于技术的改善,得到高效满足。商业世界就是这两...
知名企业家成功经营案例?
ElonMusk是一位知名企业家,他成功经营了多个领域的公司,包括电动汽车公司特斯拉、太空探索公司SpaceX和太阳能公司SolarCity等。他以颠覆传统、创新科技的方...
如何用区块链颠覆服装行业?
奢侈服装品牌Alyx采用区块链追踪服装从原材料到货架的全周期服装设计师MatthewWilliam的奢侈时装品牌Alyx宣布,将使用IotaFoundation的区块链分布式分类帐技...
高科技产业利润怎么那么高?
高科技产业属于社会推动者,对社会贡献最大,对产业颠覆力强,属于各个产业的金字塔尖,所以价值等于你金钱,自然赚钱最多。而且高科技产业从业人数不多,需要很...
有什么超级科技?
A)首先我们需要界定超级科技:能够在某一个领域或行业引发颠覆性变化,极大加速改变人类生活,工作,战争等模式的革命;然后我们来提出几个超级科技,分领域...A)首...
有哪些“黑科技”用在了家装领域呢?
东易日盛,作为家装行业首家上市公司,几年前就已经启动了数字化、科技化转型,朝着“科技家装”路前进。科技家装前进的路上,家装黑科技更是层出不穷,今天就重...