发布于: iPhone转发:0回复:1喜欢:0
拓尔思)公司在 AIGC 领域的应用案例有哪些? 回答:知识图谱是 AIGC 利用 AI 学习实现自动生成的基础之一。早 在 2015 年,拓尔思参与了一项基于大数据的类人智能关键技术与系统的 863 课题《面向基础教育的知识能力智能测评与类人答题验证-高考机器 人》,主要负责十亿级条目规模知识图谱以及大数据知识管理和检索平台 的构建,助力该“高考机器人”能实现对类人答题原型系统的试题理解、 常识记忆、语言运用、知识关联、知识推理、初等数学求解等各个智力 维度进行科学评价。该项目于 2017 年顺利通过验收。 基于 NLP 技术的文本生成可以算作是 AIGC 中发展最早的一部分技 术。2016 年,拓尔思在浙江日报报业集团的融媒体智能传播服务平台中 (简称“媒立方”),率先推出了机器写作,主要根据拓尔思的全网资讯 大数据自动生成体育、气象和财经等领域的主题稿件,推送到浙报媒立 方。 2019 年,拓尔思提出以“语义智能+行业/领域”的营销策略。公司 深耕自然语言处理,致力于以数据智能应用为核心,赋能不同行业的数 字化转型与降本增效的场景应用,并积极与客户携手,在 AIGC 相关领域, 如机器写作、对话式 AI、内容人机协同和自动报告生成等应用场景已相 继打造出一批优秀实践案例。 (二)公司在 AIGC 领域有哪些发展规划? 回答:在发展路径上,拓尔思重点发展垂直行业的专业大模型,以 “专业大模型+领域知识数据”为核,以 NLP 技术突破来推动更多 AIGC 商业落地。公司将基于通用 AIGC 大模型,专注优势行业进行专业大模型 的研发,融合学习行业特有的大数据和知识,提升大模型对行业应用的 适配性。公司也将以预训练大模型、In-Context Learning、instruction tuning 等技术为基础,将公司自主研发的文本生成、交互式生成、跨模 态生成、小样本学习、大模型与外部知识库的融合等功能作为研发重点, 突破基于大模型的 AIGC 关键技术,在问答式 AI、智能创作、搜索引擎 等领域实现成功应用。 同时,公司将加快推进“智创”(一款专注文字生成类的内容自动生 产平台)AIGC 平台的研发,该平台依托公司长期积累的自然语言处理技 术和人工智能平台产品为基础,融合开源大模型,将专注在辅助型、应 用型、创作型等文本内容的自动生成研发,以个性化、专业性的内容自 动生成为壁垒,保持在 AI 领域的技术竞争力。公司将结合优势行业和客 户群体,优先关注新闻出版、政务服务、金融领域、通用行业、元宇宙 和云服务等 AIGC 细分市场,从降本增效走向额外价值转移。 (三)公司在数据要素领域有哪些布局? 回答:数据要素作为重要的生产要素,由数据采集、存储、流通交 易、分析应用等环节构成。拓尔思将重点关注数据整理、数据质量的把 控,以及信创背景下数据要素如何释放价值。 公司正在积极推进自身数据采集、标注、存储、传输、管理、应用 等全生命周期价值管理,加强公司在政府、媒体、金融、产业大数据等 重点行业的数据应用模式探索,深化数据驱动的全流程应用。目前,公 司基于深度学习的自训练模型和专业知识域,打造了面向产业、媒体资 讯、网络舆情三大领域的数据资产平台,不仅可以面向内部数星风控、 海策政策大脑、冒烟指数、天目开源情报等云和数据服务产品进行数据 赋能,也可为政府、媒体、金融、企业、安全等行业用户提供云和数据 服务。 公司将积极推动数据产品与数据服务融合,以让数据创造价值作为 重要的业务拓展方向,助力我国数据经济建设。 (四)公司云和数据服务的收费模式和业务拓展方式是怎样的? 回答:公司云和数据服务的签约均以年为单位,付款模式主要分为 按季度、半年度、年度支付,按年付费的客户居多。产品的收费标准均 根据数据量、用户数制定,比如公司在金融行业的产品“TRS 数星金融 智能风控平台”的收费标准是根据客户监测发放贷款或投资并购的交易 对手数量而制定。 公司云和数据服务的市场拓展主要以渠道代理的形式进行,一是将 合作伙伴作为公司拓展客户的渠道,通过把公司的标准化平台产品嵌入 到合作伙伴的产品中,进而提高客户数量;二是与垂直行业的专业服务 商合作,由其进行渠道代理销售,进而拓展产品销售路径。目前已在金 融领域有成功案例。 (五)公司推出的“海贝”是一款搜索型数据库,请问和百度、360 这些常见的搜索引擎有什么不同? 回答:根据服务对象、搜索场景、搜索内容以及商业模式的不同, 搜索引擎分为互联网搜索引擎、垂直搜索引擎、企业级搜索引擎。 互联网搜索引擎是从互联网提取各个网站的信息(以网页的文字为 主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定排列顺序返回结果。垂直搜索引擎适用于有明确搜索意图情况下进行检 索。例如,用户购买机票、火车票、汽车票时,或想要浏览网络视频资 源时,都可以直接选用行业内专用搜索引擎,以准确、迅速获得相关信 息。这两种搜索引擎都是面向互联网 To C 的应用。企业级搜索引擎是 To B 或 To G 的,需要满足企业多样化的需求,特别是各种非结构化数 据的搜索使用更是重中之重,常见的应用场景包括站内搜索、企业搜索、 智能问答、数据分析、数据库加速、运维监控等。 众所周知的百度和 360 属于互联网搜索引擎,公司 TRS 海贝搜索数 据库属于企业级搜索引擎,是构建搜索引擎应用的核心支撑软件。虽然 两种类型搜索引擎的最终目标都是从庞大的知识库里取得用户需要的答 案,但各自索引的内容差异化却非常大,应用场景和侧重的技术领域也 不同。 企业级搜索针对的目标是企业内部各个应用系统中的文本文件和各 类业务数据,如内网新闻、工作资讯、工作报告、专题研报、项目文档、 知识库、培训音视频等网页和各类文件,还有 ERP 系统、CRM 系统、HR 系统中的业务数据等。这些数据存储结构、文件格式和来源等各不相同, 不同企业的内部数据千差万别。企业级搜索的核心是提高内部员工的知 识共享与工作效率,因此,对索引数据治理的高效、灵活性以及智能化, 还有检索结果返回的精准性、个性化和高响应速度提出了更高的要求。 企业级搜索还非常注重检索权限和访问权限的问题,需要继承各个业务 系统的原子权限,对安全性要求非常高。在这方面常用的互联网搜索一 般无法做到。 从产品特点上讲,公司 TRS 海贝搜索数据库是一款从内核到系统完 全国产自研的搜索型数据库,早已融入了自研的 NLP 技术,如文本分词、 自动分类、相似文本检索、拼音检索提示等,也集成了深度学习引擎, 支持以文搜图、以图搜图、图文融合搜索,可以对图像中的文字进行 OCR 识别,也可以提取图像或者文本的特征数据,通过基因编码存储到海贝 数据库里,成功实现图像相似性检索功能。而将搜索引擎技术与人工智 能技术结合,对搜索结果进行智能整理与归类,并以精准化、智能化、 个性化的方式将搜索结果呈现给用户是“海贝”的产品优势。 (六)TRS 海贝搜索数据库目前有哪些应用案例? 回答:海贝已经广泛服务于安全大数据、媒体大数据、政府大数据 以及军队大数据等众多细分行业,公安部、国家市场监督管理 总局、海关总署、专利局、商标局等一系列重量级客户都选择了公司的 产品。在国家层面,几个重大的基础数据库,例如云搜系统、企业信用 信息公示系统、专利检索系统等都构建在海贝之上。 (七)在信创的大背景下,TRS 海贝搜索数据库是否存在国产替代 的市场机遇? 回答:目前国内搜索引擎数据库市场为美国上市公司开源软件 ElasticSearch 一家独大的局面,且开源软件数据泄露和涉及国家信息 安全事件频出。信创潮下,搜索型数据库坚持自主研发是国产替代的必 由之路。 国内搜索引擎数据库厂商竞争方面,十几年前国内厂商圈也曾百花 齐放,但在 ElasticSearch 开放源代码后大部分公司退出了该领域,目 前国内坚持在搜索引擎数据库领域自主研发并保持技术领先的企业已凤 毛麟角。拓尔思作为中文全文检索技术的创始者与引领者,在相关领域 研发已有近 30 年的历史。从自主可控角度讲,海贝搜索型数据库是目前 国内少有的从底层分词算法到全文搜索引擎,以及上层系统都完全自研 的纯国产搜索引擎数据库,吸收了公司在自然语言处理和信息检索方面 的长期技术经验积累,已完成与龙芯、海光、飞腾、鲲鹏等国产芯片以 及中标麒麟、统信 UOS 等国产操作系统的适配工作,完全满足信创要求 和国产化替换需求。 (八)在海贝搜索数据库的国产替代方面,是否有成功案例? 回答:在国产替代方面,海贝已拥有众多国家标杆项目成功经验以 及本土化服务能力,积累了一套成熟的、标准化的 ElasticSearch 平滑 迁移方法,全程保障数据与业务的平滑迁移。以信用中国项目为例,该 项目由国家发展改革委、人民银行指导,国家信息中心主办。原来在某 云平台上由 ElasticSearch 对外提供检索服务,(八)在海贝搜索数据库的国产替代方面,是否有成功案例? 回答:在国产替代方面,海贝已拥有众多国家标杆项目成功经验以 及本土化服务能力,积累了一套成熟的、标准化的 ElasticSearch 平滑 迁移方法,全程保障数据与业务的平滑迁移。以信用中国项目为例,该 项目由国家发展改革委、人民银行指导,国家信息中心主办。原来在某 云平台上由 ElasticSearch 对外提供检索服务,2018 年迁移至公司“TRS 海贝大数据管理系统”上,目前海贝在该项目中每秒需要支持大约 1.2 万的并发检索,日访问量接近 10 亿,获得了用户的高度认可。 目前公司正在与行业有关部门积极沟通,同时客户群体中已产生国 产替代的实际需求,公司已在积极对接.

全部讨论

2023-02-23 22:29

中线持有