| 2026-04-24 | 东吴证券 | 王紫敬,张文佳 | 买入 | 维持 | 2025年报&2026一季报点评:业绩持续高增 | 查看详情 |
海天瑞声(688787)
事件:公司发布2025年报&2026一季报,公司2025年营收3.77亿元,同比增长59%;归母净利润0.14亿元,同比增长25%。2026年Q1营收0.97亿元,同比增长39%;归母净利润0.08亿元,同比增长2161%,符合市场预期。
投资要点
收入持续高增:分业务来看,公司2025年计算机视觉业务收入1.48亿元,同比+218%;自然语言业务收入0.51亿元,同比+112%;智能语音业务收入1.50亿元,同比-9%;训练数据相关应用服务收入0.28亿元,同比+1394%。2026Q1公司营收持续高增,主要系1)国内外头部大厂加大视频、文本等方面AI数据投入;2)地方数据标注基地项目建设加快推进;3)东南亚数据交付基地完成产能爬坡。公司2025年毛利率48%,同比下滑,主要受定制化服务业务收入占比提升影响。2026Q1公司相对高毛利的训练数据应用服务收入占比提升,整体毛利率改善至56%。
模型迭代加速推动需求快速提升:随着AI Agent、文生视频、AI编程等场景开始大规模应用,大模型以及垂类场景应用迭代速度不断加快,推动客户采购高质量专业数据的需求量和复杂度提升。公司多年服务阿里巴巴、字节跳动、腾讯、中国移动等头部客户,已成为多家行业领先企业的核心数据服务供应商,率先受益。除大厂外,公司积极拓展政府和央国企客户,已为广西、四川等地打造多类特色数据集,并同步推进湖南、内蒙古等地的专项数据集建设。2026年3月,世界数据组织成立,海天瑞声以发起单位身份深度融入。我们预计未来公司将继续推进和地方政府共建高质量数据集,推动数据标注平台和应用落地。
全球化布局持续优化:公司进一步强化北美、欧洲及日韩销售团队,深化本地化服务能力,公司在东南亚新建的数据交付基地已进入稳定运营阶段,为海外业务贡献了显著的增量收入,未来将成为支撑公司全球化战略的重要支点。
拓展具身智能等新场景:具身智能需要机器人在复杂的真实世界中实现自主感知、学习和适应,该能力的构建依赖海量来自“真实物理环境”的动态交互数据进行训练。目前相关数据获取成本高、覆盖场景有限,供需缺口非常大。公司已与国内某头部具身厂商签署真机数据采集合约,并与多家头部具身厂商、科技大厂及地方政府启动订单对接,有望成为公司新的增长点。
盈利预测与投资评级:高质量数据集是人工智能发展的基础,公司是A股稀缺的专注提供AI训练数据解决方案的领军企业,2026Q1新签订单及确认合作待签署订单同比增长超100%,业绩有望持续高增,我们将公司2026-2027年EPS由0.92/1.50元调整至0.93/1.47元,预计2028年EPS为2.26元,维持“买入”评级。
风险提示:行业竞争加剧,项目回款不及预期,研发进展不及预期。 |
| 2025-06-22 | 东吴证券 | 王紫敬 | 买入 | 首次 | AI数据领军企业,全球化布局打造第二成长曲线 | 查看详情 |
海天瑞声(688787)
投资要点
国内AI训练数据解决方案领军企业:海天瑞声是AI数据行业首家科创板上市公司,致力于为AI企业、研发机构提供AI数据集及服务。董事长和实控人贺琳曾任职于中国科学院声学研究所,管理层技术背景强。中移投资是海天瑞声首发前股东之一,公司持续与中国移动保持紧密战略协同。公司业务主要涵盖智能语音、计算机视觉、自然语言等方向。2024年,大模型加速促进收入修复,高毛利产品收入占比提升带动盈利质量改善。2024年公司营收2.37亿元,同比增长39%,归母净利润0.11亿元,扭亏为盈。
数据标注产业迎来政策催化,大模型加速成长。2025年1月,国家发展改革委等4部门发布《关于促进数据标注产业高质量发展的实施意见》,提出到2027年,数据标注产业规模大幅跃升,年均复合增长率超过20%。大模型驱动数据需求剧增。scaling law证明了通过预训练使用更多的数据和算力,能够让AI模型的性能大幅提升。大模型提升对高质量专业数据集需求,对数据集需求正从“通用知识”向“专业知识”延伸拓展,带动数据标注市场需求,根据中商情报网,2025年中国数据标注市场规模有望突破100亿元。目前市场以品牌数据服务商和需求方自建团队为主,市场集中度有所提升。
从Scale AI看海天瑞声的成长曲线。美国Scale AI专注于为人工智能和机器学习应用提供高质量的数据标注和管理服务。2024年Scale AI以138亿美元的估值完成了一轮10亿美元融资,英伟达、亚马逊、Meta、英特尔等科技巨头纷纷入局。公司主要服务大厂和政府客户,外包标注团队,并加强自动化标注水平,陆续斩获上亿美元美国国防部大单,由数据标注服务深入到AI模型应用落地。
海天瑞声:全球化布局,加强政府和产业合作。2024年,公司通过在新加坡投资设立控股公司的方式拓展海外首个自主可控的数据交付基地,并积极拓展智能终端等领域海外客户,2024年公司境外收入同比增长89.53%至1.14亿元。公司持续深化政企合作,已经和河北保定、湖南长沙等地政府合作成立合资公司,布局数据标注基地全周期运营,并发布了DeepSeek行业智能体解决方案,从数据标注拓展AI应用落地,打开成长新空间。
盈利预测与投资评级:高质量数据集是人工智能发展的基础,公司是A股稀缺的专注提供AI训练数据解决方案的领军企业,未来有望持续获得互联网、央国企等客户订单,深度受益于AI大模型开发迭代和应用落地,我们预计公司2025-2027年营收分别为3.45/4.83/6.44亿元,归母净利润分别为0.32/0.56/0.91亿元,首次覆盖,给予“买入”评级。
风险提示:政策推进不及预期,行业竞争加剧,项目回款不及预期,研发进展不及预期。 |
| 2025-05-30 | 中邮证券 | 孙业亮,常雨婷 | 买入 | 首次 | AI数据训练龙头,挖掘数据集价值 | 查看详情 |
海天瑞声(688787)
l领先的AI数据训练服务商,业绩拐点已至
公司是我国领先的AI训练数据专业提供商,自2005年成立以来致力于为AI产业链上的各类机构提供AI算法模型开发训练所需的专业数据集。公司所提供的训练数据覆盖智能语音(语音识别、语音合成等)、计算机视觉、自然语言等多个AI核心领域,全面服务于人机交互、智能驾驶、智慧城市等多种创新应用场景。公司的产品和服务已获得阿里巴巴、腾讯、百度、科大讯飞、海康威视、微软、亚马逊、三星等国内外客户的认可,应用于其研发的个人助手、智能音箱、语音导航、搜索服务、智能驾驶、机器翻译等多种人工智能产品相关算法模型的训练过程中。
2024年,公司实现营业收入2.37亿元,同比增长39.45%,主要系大模型技术的快速发展以及应用场景不断落地,以多语种、多音色等为代表的智能语音业务需求、以及以指令微调、偏好对齐等为代表的自然语言业务需求同比均呈现大幅增长。公司归母净利润、扣非净利润分别为1,133.61万元、497.35万元,同比实现盈利,主要系高毛利的数据集产品占比提升及定制服务毛利率提升,同时信用减值损失同比下降。2025年一季度,公司营收同比快速增长71.75%至6,980.95万元,归母净利润实现扭亏。
l数据集是核心竞争力,央企AI训练需求快速增长
标准化数据集产品是公司核心竞争力之一。截至2024年底,公司新增研发超150个训练数据集产品,自有知识产权的训练数据产品储备超过1,700个,建成包括“大语言模型中文对话预训练数据集”、“语音大模型(声音复刻、歌曲)预训练及微调数据集”、“视觉大模型(图像-文本)预训练及微调数据集”等在内的多领域大模型数据集。
在国家"AI+数据要素"战略的指引下,尤其是国务院国资委连续两年开年启动部署中央企业“AI+”专项行动以来,以运营商为代表的重点央企自2024年起加速布局通用+垂向大模型研发,带动了高质量图像、视频等训练数据的规模化采购需求。公司凭借在数据领域的核心优势,已快速成为运营商类客户重要的数据服务供应商。
l探索数据要素新模式,与政府共建可信数据空间
4月30日,全国数据标准化技术委员会正式发布了《可信数据空间技术架构》技术文件,从技术功能、业务流程、安全要求等方面对可信数据空间进行了规范,为数据基础设施试点及地方、行业、领域、企业数据空间的规划、建设、运营和管理提供指导。
目前公司积极探索与实践数据产业新业务和新模式,与多地政府、地方运营商等开展战略合作,构建“数据可信空间”,协助地方政府打造安全、高效、合规的数据治理与流通体系,推动数据要素的价值释放。
l携手华为发布Deepseek数据飞轮智能体
5月23日,鲲鹏昇腾开发者峰会2025(KADC2025)在北京中关村国际创新中心举办。会上,海天瑞声CTO黄宇凯与华为昇腾计算业务副总裁王庆文共同发布海天瑞声X昇腾DeepSeek数据飞轮智能体。本次联合推出的数据飞轮智能体解决方案,基于昇腾AI基础软硬件平台,搭载高性能硬件配置,为企业提供强大的算力支撑。软件层面整合了海天瑞声数据飞轮智能体平台、DOTS数据标注平台及AI研发平台,构建了从数据标注到模型训练的完整闭环。
l投资建议与盈利预测
预计公司2025-2027年的EPS分别为0.33、0.49、0.70元,当前股价对应的PE分别为290.74、192.52、135.94倍。公司是国内领先的AI数据训练服务商,伴随大模型在央国企及传统行业的应用落地,预计未来相关数据需求将进一步增长,为公司带来持续增长动力。首次覆盖,给予“买入”评级。
l风险提示
技术迭代不及预期;产品推广不及预期;市场竞争加剧等 |
| 2023-01-08 | 浙商证券 | 程兵 | 买入 | 首次 | 海天瑞声深度报告:国内AI训练数据龙头提供商,自动驾驶业务打开成长空间 | 查看详情 |
海天瑞声(688787)
投资要点
公司是国内领先的人工智能数据标注提供商,提供AI算法模型开发所需的专业数据集,业务覆盖智能语音、计算机视觉、自然语言等场景,并积极布局自动驾驶业务,未来有望打开公司成长空间。公司产品服务在人机交互、智能家居、智慧城市等领域均有深度应用,对标海外龙头ScaleAI和Appen,我们认为公司有望充分受益于数据要素生态构建和人工智能产业加速发展,并且在自动驾驶新业务加持下,实现业务的快速增长。
AI进入数据智能时代,质量+规模拉动数据标注需求快速成长
人工智能行业持续成长,模型复杂度和算力提升拉动了训练数据需求量的加速提升,根据Congnilytica预测,到2027年全球AI训练数据市场需求将达到220亿美元,而观研天下数据中心预测到2029年,我国数据标注行业市场规模将达到204.3亿元。数据规模以及质量需求升高将拉动数据标注行业的快速成长。
自动驾驶渗透率提升,公司智能驾驶数据业务有望迎来爆发
公司积极布局自动驾驶相关业务,于2022年6月上线第三代智能驾驶标注平台并发力研发第四代产品,截至2022年第三季度,公司已验收订单以及在手订单合计约5000万元,同比增长超200%。我们认为随着自动驾驶渗透率提升,叠加技术向L3及以上级别发展,数据标注需求将快速成长,公司已设立独立的自动驾驶事业部并配置专项研发、销售、产品和项目交付团队,未来相关业务有望实现高速增长。
持续布局语音语义赛道,多语种为公司核心技术壁垒
公司基于多年语音识别及合成领域的技术积累,在多语种领域构筑深厚技术壁垒。截至2022H1,公司拥有190个语种/方言的覆盖能力,累积词条数超过1000万。公司持续布局海外市场,2022年H1境外收入占总收入达57.14%,境外市场签单额同比增长近2.5倍,前三季度境外基础训练数据业务收入同比增长近140%。我们认为随着公司海外业务的加速布局,能够更好地发挥公司在语音和自然语言领域的多语种优势,打开公司广阔成长空间。
盈利预测与估值
我们预计公司2022-2024年实现营业收入分别为2.67/4.00/5.48亿元,同比增长分别为29.36%/49.67%/37.00%;对应归母净利润分别为0.14/0.45/1.02亿元,同比增速分别为-56.75%/230.52%/126.32%,对应EPS为0.32/1.06/2.39元,对应PE分别为205.04/62.04/27.41倍。首次覆盖予以“买入”评级。
风险提示
1、技术迭代风险;2、汇率波动风险;3、新客户拓展不及预期带来的风险;4、市场竞争加剧风险; |
| 2022-11-07 | 天风证券 | 缪欣君,张若凡 | 买入 | 首次 | 自动驾驶刚需,稀缺的AI数据标注“智能工厂” | 查看详情 |
海天瑞声(688787)
海天瑞声:国内领先的 AI 训练数据专业提供商。 公司致力于为 AI 产业链上的各类机构提供算法模型开发训练所需的专业数据集。公司所提供的训练数据覆盖智能语音(语音识别、语音合成等)、计算机视觉、自然语言等多个核心领域,全面服务于人机交互、 自动驾驶、智能家居、智慧城市等多种创新应用场景。其中智能语音为公司的优势领域,产品线已包含 190个主要语种及方言。 公司的产品和服务已获得字节跳动、阿里巴巴、腾讯、百度、科大讯飞、海康威视、微软、亚马逊、三星、中国科学院、清华大学等国内外客户的认可,应用于其研发的个人助手、智能音箱、语音导航、搜索服务、短视频、虚拟人、 自动驾驶、机器翻译等多种产品相关的算法模型训练过程中。公司客户累计数量 740 家,覆盖了科技互联网、社交、IoT、 自动驾驶、智慧金融等领域的主流企业,教育科研机构以及部分政企机构。
自动驾驶或将加速落地,公司有望迎来首个行业级数据业务高增长。 根据IDC 发布的《中国自动驾驶汽车市场数据追踪报告》, 2022 年一季度 L2 级自动驾驶在乘用车市场的新车渗透率达 23.2%,整个市场处于 L2 向 L3+级别发展的阶段。随着激光雷达的铺货、成本的降低以及自动驾驶相关政策性文件的推出或将加速 L3+级别自动驾驶的落地。自动驾驶技术的迭代需依赖大量的数据进行训练,数据贯穿研发、测试、量产、运营维护等全生命周期。此外,伴随智能网联汽车传感器数量的快速增加,自动驾驶车辆的数据生成量也将呈现指数级增长,这都将带来大量的数据处理需求。公司强力布局自动驾驶业务,开启车载语音数据及 DMS/OMS 数据业务并日臻成熟,舱外视觉场景数据业务亦基本实现全覆盖。公司已设立独立自动驾驶事业部并配置专项研发、销售、产品、项目交付团队,通过快速迭代平台工具及算法迅速提升自动驾驶业务竞争力,实现自动驾业务的快速扩张, 2022 年前三季度已验收订单与截止三季度末在手订单合计约 5,000 万元,同比增长超 200%。我们认为,在自动驾驶整体加速落地的大背景下,公司自身自动驾驶数据业务能力构建基本完成, 预期将同步实现快速提升,有望带动整体业务实现高速增长。
对标 Scale.AI,人机协同降本增效,有望提升毛利率。 公司今年 6 月上线第三代自动驾驶标注平台,已基本实现自动驾驶舱外视觉场景的全覆盖。
并将于年底前上线第四代自动驾驶数据处理平台,将进一步升级工具和算法功能,可支持各类型传感器及多传感器融合的数据处理、 BEV(鸟瞰图)标注、点云叠加标注等多类前沿标注需求;同时算法中台能力也将持续提升。我们认为,公司自动驾驶数据标注过程中算法的引入有望降低公司的人工成本,从而提升业务毛利率。
数安合规将重塑自动驾驶数据产业格局。 今年 8 月末,自然资源部发布相关通知,规定了从事测绘相关工作的内资企业需获得相应资质方能准入,外商投资企业则不能申请、应委托具有相应资质的单位开展相应测绘活动。这意味着未取得测绘资质的企业将不得从事自动驾驶舱外数据的处理(包括但不限于采集、标注等)工作,进一步提高了行业准入门槛。我们认为,未来拥有测绘资质的企业将能够更快抢占自动驾驶数据市场。公司已于今年 6 月获批乙级测绘资质, 同时受中国移动、中国互联网投资基金战略股东加持, 相信将为其自动驾驶领域业务的拓展奠定更好的基础。
2022 年上半年境外市场签单额同比增长近 2.5 倍,前三季度境外基础训练数据业务收入同比增长近 140%。 近年来,公司力拓全球市场,使之成为公司收入和毛利的重要支撑。 2022 年,公司已启动更为全面的全球化发展战略,从品牌升级、体系搭建、团队建设、营销推广等多维度升级海外市场布局,预期未来将继续成为公司收入和毛利增长的重要引擎。
我们预计,公司 2022-2024 年营收分别为 2.65/3.97/6.09 亿元, 归母净利润为 0.14/0.62/1.31 亿元,对应当前市值 PE 分别为 191/43/20 倍。
2022 年收入拐点已现,可持续增长预期高, 2023 年有望迎来利润释放。考虑自动驾驶行业数据业务有较高成长性,本报告采用分部估值法:
基础数据业务:考虑公司语音方面积累深厚,尤其是多语种方面的积累和能力,可以更好服务境外公司全球化布局。公司从 2021 年开始制定了更为全面的全球化发展战略,从品牌升级、体系搭建、团队建设、营销推广等多维度升级海外市场布局,大大提升海外客户触达和服务能力, 2022 年上半年境外业务增势显著,考虑以上情况,对该部分适用 PE 估值方法。根据我们预测, 2023 年基础数据业务净利润达 0.54 亿元,参考可比公司中科创达/四维图新/德赛西威 PE 估值平均 45.51x,考虑公司境外基础数据业务增速较快给予该业务 2023 年 50x P/E,对应市值 27 亿元。
智能驾驶行业数据业务:考虑自动驾驶的高景气度,公司对自动驾驶平台的持续高投入,且获得乙级测绘资质,公司计算机视觉业务营收有望迎来高增长,考虑该业务的高投入及高成长性,对公司该部分适用 PS 估值方法。根据我们预测, 2023 年公司智能驾驶行业数据业务营收达 1.09 亿元,参考可比公司格灵深瞳/中科创达/虹软科技 PS 估值平均 10.29x,鉴于公司智能驾驶行业数据业务为新业务且增速较快,给予该业务 2023 年 12x P/S,对应市值 13.08 亿元。
综上,结合基础数据业务 PE 估值以及智能驾驶行业数据业务 PS 估值,给予公司目标市值 40.08 亿元,目标价 93.64 元,首次覆盖,给予“买入”评级。
风险提示: 技术迭代风险;汇率波动风险; 新客户收入占比较低的风险;市场竞争加剧风险。 |