AI CON HK 2024精华回顾 | 2024国际开源节 & AI CON HK年终大会预告

5月25日，在充满活力和创新力的香港，AI CON HK 2024大会成功吸引了近百名全球人工智能领域的技术专家、学术领袖和创新者的现场参与，以及超过5000名线上专业观众，共同探讨和展示了AI技术的最新发展和未来趋势。这场盛会不仅为与会者提供了洞见丰富的AI主题演讲，还举办了深度的AI+行业圆桌讨论，内容覆盖了AI安全到AIGC产业的广泛议题。

AI+安全专场

香港城市大学协理副校长 张泽松教授的欢迎致辞

大会在香港城市大学张泽松教授（Prof Ray）的致辞中温暖开场。Prof Ray分享了CityU的教育优势和创新理念，展示了香港城市大学在学术和研究领域的实力，以及对培养未来科技领袖的承诺。

14. png.png

LF AI & DATA董事会主席 孟伟的大会致辞

随后，孟伟以其在开源领域的深厚背景，为AI CON HK 2024揭开序幕。他强调国际开源基金会、开源社区在推动技术创新中的重要作用，并展望了AI技术和开源创新如何塑造未来和推动本地产学研多方面共同发展。

蜚语科技的创始人兼CEO 束骏亮：开源大模型与漏洞治理
接着，束骏亮上台分享，在AI CON HK 2024上午场的演讲中，束骏亮深入探讨了开源大模型在提升漏洞挖掘与治理能力方面的应用。他首先介绍了蜚语科技的使命——让人类能够更好地理解代码，并强调了静态分析工具Corax在提升软件研发过程中代码质量和安全方面的重要性。束骏亮指出，尽管静态分析是漏洞挖掘和治理的基础技术，但现有的主流工具存在误报率高、配置复杂等问题。他提出了利用大模型来解决这些问题的创新思路，并通过实际案例展示了如何通过结合大模型和程序分析来提高代码审计的准确性和效率。此外，他还分享了在开源项目中发现的近200个bug，并提供了相关工具和论文的链接，供与会者进一步探索和学习。束骏亮的演讲不仅展示了蜚语科技在代码分析领域的专业能力，也为听众提供了关于如何利用AI技术优化软件开发流程的深刻见解。

香港科技大学 吴道远：构建基于大模型的智能漏洞审计引擎
活动上半场接近尾声，来自香港科技大学的吴道远教授，分享了他对构建基于大模型的智能漏洞审计引擎的见解。他首先提出了大模型在安全领域的应用前景，包括漏洞检测、形式化验证、漏洞修复以及恶意软件检测等。吴道远强调了大模型在理解复杂代码逻辑和提高漏洞检测准确性方面的潜力。

他介绍了GPTScan，这是首个基于大模型的漏洞分析流程，能够选择与漏洞类型相关的代码，识别关键变量和语句，并进行静态确认。GPTScan不仅准确率高，具有较低的误报率，而且在分析速度和成本效益方面表现出色。此外，GPTScan还能够发现人类专家可能遗漏的漏洞，证明了其作为人工审计补充工具的价值。

吴道远还探讨了大模型在自动提取漏洞知识方面的潜力，并提出了LLM4Vuln，这是一种基于大模型的漏洞检测范式。他的演讲不仅展示了大模型在提升软件安全性方面的应用，也为听众提供了关于如何利用AI技术进行高效漏洞审计的新思路。

火山引擎大模型安全产品与解决方案总监 林泽韬：火山引擎大模型安全应用
接下来由火山引擎大模型安全产品与解决方案总监林泽韬先生上场分享，他分享了大模型安全应用的实践与策略。他强调了数据隐私、知识产权保护、数据质量对AI输出的重要性，并指出了监管合规的挑战。林泽韬介绍了火山引擎的安全架构，包括安全评测、防火墙和数据安全沙箱，旨在提供闭环保护。他提出了“一矛一盾一沙箱”的概念，分别代表安全测评、API防护和数据保护。演讲还涵盖了智能脱敏技术和安全大模型在智能安全运营中的应用，展示了火山引擎如何通过这些措施保障AI模型的安全性和可靠性。

圆桌讨论：AI大模型与安全的未来
在上午场的最后一个环节，我们迎来了一场精彩的圆桌讨论，主题为“AI大模型与安全”。这场讨论由以下嘉宾共同参与：

·束骏亮，蜚语科技创始人兼CEO

·林泽韬，火山引擎大模型安全产品与解决方案总监

·郑明，极安云（深圳）科技有限公司首席布道师

·Shawn Chang，Founder of HardenedLinux and HardenedVault

·马志国，斗象科技深圳分公司总经理

·吴道远，香港科技大学计算机科学与工程系研究助理教授

这些杰出的专家们共同探讨了AI大模型在安全领域的应用，包括潜在的风险、伦理问题以及未来的发展方向。他们深入交换了意见，并就如何平衡创新与安全、促进AI技术的健康发展提出了宝贵的见解。

AIGC产业论坛

Linux基金会战略副总裁 Ibrahim Haddad的战略视角
Linux基金会战略副总裁Ibrahim Haddad先生为下午场致开幕词，LF AI & DATA全景生态和Generative AI Commons在推动AI大模型和产业发展中的核心作用。

腾讯混元文生图技术总监 芦清林：腾讯混元文生图大模型
接着，来自腾讯的芦清林先生详细介绍了腾讯混元文生图大模型的最新进展。他首先阐述了文生图算法核心DIT（Diffusion Models with Transformers）的重要性，标志着视觉生成技术的新篇章。DIT技术通过结合扩散模型和Transformer架构，提升了模型的扩展性和图像生成的精度。

芦清林接着介绍了第三代SD大模型Stable Diffusion 3，这是一个高质量图像生成模型，以及SORA，一个能够创建现实且富有想象力场景的视频/图像生成模型。他强调了HunYuan-DIT三大升级：更强大的建模能力、原生中文理解能力以及多轮对话能力，这些升级显著增强了模型的表达能力和稳定性。

此外，芦清林还讨论了HunYuan-DiT架构的优势，包括稳定的训练过程、易适配社区插件、支持多分辨率图像输出，并提升了不同分辨率生成图像的质量。他还提到了模型结构的优化，支持数十亿参数和1024分辨率的模型，以及对中文认知的深刻理解，让模型能够更细致地区分不同信息。

演讲的精华在于展示了腾讯在AI视觉生成领域的创新和突破，以及如何通过技术升级提升图像和视频生成的质量和效率。

中兴通讯开源负责人 孟伟：AI与LLM改变编程
孟伟再次登台，这次他聚焦于中兴通讯在大语言模型（LLM）领域的进展和应用。他首先概述了LLM从通用模型向特定行业应用的转变，强调了在不同领域通过增量预训练引入专业知识的重要性。

孟伟提出了一个由基础大型基础模型支撑的架构，这些模型确保了自主可控性和数据资产安全。他详细讨论了AI在研发流程中的应用，包括需求管理、设计、开发管线、代码分析、测试管理、版本发布等环节，展示了AI如何提升研发效率。

演讲中，孟伟还介绍了LLM应用开发范式，包括专业知识注入、通用知识注入以及行业特定LLM的开发。他强调了大型模型推理效率的提升和成本降低，以及如何通过开源模型进行增量预训练，进而微调和部署以满足公司内部辅助编程场景的应用。

此外，孟伟分享了基本LLM选择的理念，考虑模型在编程领域能力、模型参数数量以及是否支持中文或民族语言能力。他还探讨了增强预训练的技术，如ZeRO存储优化和FlashAttention，以及微调方法的选择，包括prefix tuning、P-tuning v2、Full fine tuning和LoRa。

最后，孟伟通过实际案例展示了模型微调的效果，包括资源使用和基于HumanEval@Pass1指标的代码能力微调效果，突显了经过微调的模型在提升编程性能方面的显著进步。他的演讲为听众提供了对LLM在企业级应用中潜力的深刻见解。

GDG HK 锺卓熹：Google Gemini 1.5 Flash
很快来到下一位嘉宾，锺卓熹在AI CON HK 2024下午场的演讲中，向听众介绍了Google最新的多模态大型语言模型（LLM）——Gemini 1.5 Flash。他强调了Gemini模型在处理多模态和长上下文能力方面的突破，这标志着生成性AI创新的下一个阶段。

演讲中，锺卓熹突出了Gemini 1.5 Pro的几个关键特点：

1.Mixture-of-Experts (MoE) 架构：这种新架构提供了更高效的训练和服务，同时增强了模型性能。

2.扩展的上下文窗口：模型能够处理高达100万个token的复杂推理，跨越大量信息。

3.多模态理解与推理：Gemini 1.5 Pro在文本、代码、图像、音频和视频等多种模态上展现了更好的理解和推理能力。

4.伦理和安全测试：模型经过了广泛的伦理和安全测试，构建在对安全风险的新研究之上，并利用红队技术测试潜在的危害。

此外，锺卓熹还提到了Gemini生态系统，它为开发者、消费者以及企业和企业用户提供了先进的AI能力。Google提供了Gemini API、在Google Workspace中的应用、以及在Google Cloud和Vertex AI中的集成。

演讲的精华在于展示了Google如何通过负责任和安全的AI实践，推动AI技术的创新边界，使AI对每个人都更有帮助。通过Gemini 1.5 Pro模型，Google展示了其在AI领域的领导地位和对未来技术发展的承诺。

史少锋：Datastrato的下一代数据目录
接下来到史少锋上场分享，作为Datastrato的工程副总裁，他介绍了公司开发的下一代数据目录——Project Gravitino。

演讲的精华包括：

1.多云和地区数据孤岛问题：史少锋指出，在多云环境中处理数据时面临的挑战，包括难以集中处理、迁移成本高昂，以及跨境数据传输的成本和法规要求

2.Lakehouse架构的局限性：他讨论了当前Lakehouse架构无法满足所有场景下统一数据的需求，特别是在成本、性能和法规遵从方面。

3.Gravitino项目：史少锋详细介绍了Gravitino，这是一个旨在打破数据孤岛、构建组织间数据织物的项目。Gravitino通过智能分析数据，支持AI操作。

4.统一元数据湖：他展示了如何使用Gravitino构建统一的元数据湖，提供访问控制、血统、优化和审计等功能。

5.Gravitino架构：史少锋解释了Gravitino的架构设计，包括功能层、接口层和核心对象模型，以及如何通过连接器支持多种数据引擎。

6.数据和AI资产管理：他讨论了Gravitino如何帮助企业集中管理数据和AI资产，包括统一的安全模型和简化的数据访问控制。

7.Gravitino社区和贡献：史少锋鼓励听众加入Gravitino社区，贡献代码，并利用开放技术共同推动数据技术的发展。

史少锋的演讲为听众提供了一个关于如何通过创新的数据目录解决方案来克服数据管理和治理挑战的深刻见解。

Linux基金会亚太区副总裁 杨轩：带你进入Linux Foundation的开源世界
然后，杨轩代表Linux Foundation APAC，上台深入探讨了开源在当今技术生态系统中的重要性和影响。

演讲精华包括：

1.开源在软件供应链中的核心作用：杨轩强调了97%的商业代码库包含开源软件（OSS），以及78%的代码行数是开源的，突出了开源对现代软件开发的基础性贡献

2.Linux Foundation的多元化关注领域：他介绍了Linux Foundation不仅仅关注Linux，还涵盖了安全、网络、云计算、汽车、区块链、边缘计算/物联网、Web、人工智能等多个关键技术领域。

3.构建生态系统的重要性：杨轩解释了成功的开源项目依赖于成员、开发者、标准和基础设施，以及Linux Foundation如何帮助项目在五个关键领域构建生态系。

4.Linux Foundation的平台支持：他概述了Linux Foundation为项目提供的支持，包括社区建设、IT运维、项目管理、技术指导和社区项目等。

5.行业关键项目的推动：杨轩展示了Linux Foundation如何促进行业关键项目的发展，如Linux在云、移动、企业、嵌入式、汽车等领域的广泛应用，以及对AI项目如PyTorch的推动。

6.LF AI & Data的生态系统：他介绍了LF AI & Data生态系统的增长，以及它如何降低进入AI领域的门槛。

7.全球社区的贡献：杨轩还提到了Linux Foundation如何管理知识产权，提供培训和认证，以及如何通过各种活动和研究促进开源文化的全球参与和贡献。

杨轩的演讲为听众提供了对开源如何塑造技术发展和创新的深刻理解，以及Linux Foundation在其中扮演的关键角色。

香港科技协进会副会长 李德豪：AI大模型下的大湾区机遇
下一位演讲嘉宾李德豪博士在AI CON HK 2024的演讲中，他聚焦于AI大模型在大湾区（GBA）带来的机遇。他首先概述了中国在国家计算网络和“东数西算”战略方面的宏观政策进展，强调了这一战略如何促进东西部地区的计算资源平衡。李博士随后介绍了新兴产业集群的分布，包括容灾中心、数据交易、智慧灯柱等，并强调了产教融合在激发内生型创新标准中的重要作用。他还提到了特色元宇宙（MetaChinese+）的概念，结合5G和其他前沿技术，展示了大湾区在AI和数字产业中的潜力。李博士的演讲为听众描绘了一个由AI LLM推动的，充满创新和合作机会的大湾区未来蓝图。

中国开源软件推进联盟常务副秘书长 宋可为：为AI凝聚开源人才
接下来，来自北京的宋可为讲师在AI CON HK 2024下午场的演讲中，强调了开源人才在人工智能时代的重要性。他首先分享了自己丰富的开源领域经验，包括参与建设OpenDesktop社区、担任中国自由软件日联席主席等。宋可为强调，开源技术生态在长期内将逐步超越闭源生态，促进知识共享和技术创新。

他对比分析了开源与闭源大模型（LLM）的优劣，指出开源能够吸引开发者参与改进，提升模型透明度和安全性，而闭源则可能面临技术多样性瓶颈和产业生态碎片化的问题。宋可为还介绍了中国在开源LLM方面的进展，如百度飞桨、阿里通义千问等，并强调了开源人才对于加速AI技术研发、降低成本、激发创新活力的重要作用。

最后，他提出了几点建议：在教育中加入开源文化和AI技术课程，扩大国际合作，积极参与全球开源AI技术社区，并通过组织技术竞赛和创业大赛等活动，发现和培养优秀的开源AI人才。宋可为的演讲为听众提供了关于开源在推动AI发展中的关键作用的深刻见解。

重庆天工开物开源基金会执行副秘书长 庄表伟：AI涌现时代的教育进化
活动来到尾声，庄表伟深入探讨了人工智能时代教育的进化路径。他首先指出了AI技术对传统职业的冲击，如办公室文员、翻译、刑侦人员等，并提出未来社会对人才的需求将转向快速使用工具、创造新工具和驾驭工具的能力。

庄表伟强调，教育需要适应这些变化，培养具备人本思维、工程思维、计算思维和数据思维的人才，并探讨了教师、学校和课程如何适应这种转变。他提出AI技术将助力教育创新，实现个性化学习、仿真操作实训，并推动教育领域的信息化、数字化和智能化。

演讲中，庄表伟还介绍了基于AI大模型分析的开源实训课程，如何利用AI完成Code Review、评分和案例教学。他提出开源基金会在教育探索中的作用，包括开源贡献者、贡献者协议、资金支持等，并展示了天工开物开源基金会如何推动教育领域的开放式协作。

最后，庄表伟以“为这正在改变的时代——我们可以做些什么？”作为结语，呼吁开源基金会找准定位，共同探索教育的未来。他的演讲为听众提供了关于AI时代教育如何适应和引领变革的深刻见解。

圆桌讨论：AI+投资的未来
下午场的最后一个环节“AI+投资圆桌论坛”汇聚了杨轩、堵俊平、王堃、孙逸兴以及孟伟等行业专家，共同探讨了AI领域的投资趋势、机遇与挑战，主要是以下几点：

1.投资趋势：专家们讨论了AI技术快速发展给投资领域带来的新趋势，包括对初创企业的关注以及对成熟AI解决方案的投资。

2.机遇识别：论坛强调了识别AI领域中的新兴机会，特别是在健康医疗、教育、金融等行业的应用潜力。

3.风险管理：讨论了投资者如何评估和管理与AI相关的技术风险和市场风险。

4.跨界合作：专家们认为跨界合作是推动AI创新的关键，鼓励投资者寻找与技术、产业和学术界的合作伙伴。

5.政策与市场环境：分析了政策环境对AI投资的影响，以及如何利用政策优势促进投资回报。

6.未来展望：对AI技术未来的发展方向进行了展望，包括对AI伦理、可解释性和安全性的关注。

圆桌论坛为投资者和AI创业者提供了宝贵的视角，帮助他们更好地理解AI领域的复杂性，并作出明智的投资和创业行动决策。

AI CON HK 2024不仅是人工智能产业和学术届技术研究的展示，更是智慧的碰撞。这场大会为与会者带来了深刻的洞见，激发了对人工智能未来可能性的无限遐想。

我们由衷地感谢中国开源软件推进联盟名誉主席陆首群，Linux Foundation战略副总裁Ibrahim Haddad，LF AI & DATA董事会主席、中兴通讯开源负责人孟伟，以及香港城市大学张泽松教授对本次大会的鼎力支持，同时也感谢协办单位上海市人工智能行业协会、华南技术转移中心、广州市天河区软件和信息产业协会、开源科技OSTech、上海探巡科技、ChaosAI、开源高校联盟、蜚语科技对本次大会的协办支持，以及所有演讲嘉宾和社区媒体支持单位的大力支持和贡献。我们期待在“AI CON HK”年终大会和“2024国际开源节香港站”上再次相聚！

特别鸣谢以下合作伙伴

Linux基金会开源软件学园（LFOSSA）福利！

为了感谢所有支持AICON的朋友，LFOSSA把优惠延伸给大家！大家凭以下优惠码，到LFOSSA官网或Linux基金会培训及认证全球官网购买所有LF官方原生线上课程、认证或套购产品，马上可获 8折优惠，优惠期至5月31日。

折扣码：2024AICon-41fb61

适用于LFOSSA官网：https://training.linuxfoundation.cn

折扣码：LFAPAC_AICON20

适用于全球官网：https://training.linuxfoundation.org

年度大会预告

* 2024 International Open Source Festival（IOSF） HK + AI CON HK Year End Party

* 2024 International Open Source Festival（IOSF） GZ + Google DevFest 广州国际嘉年华

关于开源科技OSTech

OSTech 成立于中国深圳，并于2023年和2024年分别在新加坡和香港成立事业发展部，核心团队具备成熟的 web 3 和 AIGC 应用开发能力和项目经验，也是多家知名国企和世界500强的项目合作伙伴。

此外，OSTech 与 Linux Foundation APAC 、Google、中兴通讯ZTE、SUSTech 等知名企业和顶级高校合作运营包括：开源高校联盟、GDG、SUSTech OpenSource Club 等开发者社区和高校科技俱乐部，并成功建立包括 International Open Source Festival（简称“IOSF”）、AI CON 等科技与人工智能品牌大会，具有丰富的科技品牌营运和产学研生态共建经验。

合作咨询

微信：tsltruth

邮箱：tonytang@ostechhome.com