竞博job·阿里云助力金数据打造新时代的AI考试系统——大模型加持让出题效率千倍提升


评测系统 发布时间:2024-07-18 09:22:36 来源:竞博官网登录 作者:竞博job在线登录

2024-07-18

  企服赛道发展进入平缓期,越来越多企业客户追求个性化、定制化的解决方案,对坚持PLG(Product-Led Growth)模式的企服公司来说,产品面临更严苛的评判标准付费挑战:一方面,产品需要更加易用,用户能够自行上手并快速体会到产品价值;另一方面,产品需要在“降本增效”的金标准中表现更加突出,以撬动用户付费来支撑业务的正向循环。

  金数据是全网TOP级别的问卷表单企服公司,2012年成立之初就开始使用阿里云打造线上数据收集管理的企服产品,目前存量用户1200万,与5000余家企业单位达成深度合作,实现了用户增长和付费闭环的验证。

  AI浪潮下,借助阿里云通义大模型,金数据打造了“金数据AI考试”PLG产品,从4月上线至今,线上用户数已经破万,日调用token万级别,成为企服赛道AI落地应用的一匹黑马。在第五季阿里云Create@AI创客松大赛中,“金数据AI考试”脱颖而出,获得“阿里云通义大模型最佳伙伴奖”。

  本期「看见新力量」栏目与金数据CTO冯智超进行对话,由他带我们走进AI企服应用落地的实践之旅。

  金数据的创立起点,源于团队的亲身经历。金数据团队中超过一半是产品研发技术人员,核心团队成员大多曾在ThoughtWorks软件咨询公司工作。但他们发现,尽管当时的软件和互联网已经相当发达,许多小团队和个人的业务需求仍未被IT技术充分满足。一个印象深刻的例子是,当时一位行政同事需要为公司印制一批T恤衫,“他非常痛苦地使用邮件和Excel表格来收集并统计一百多个同事所需的颜色和尺码。”这次经历让冯智超和团队想到,为什么不创建一个可以轻松收集和管理信息的在线工具呢?于是就有了“金数据”,团队成为国内最早开始做在线表单的一批人。

  彼时是2012年,“上云”并未像现在一样普及,但金数据从一开始就选择了云服务。“从公司的第一天,我们就倾向于所有的服务都是用云服务。”技术出身的冯智超和团队清晰地意识到,国内市场环境变化非常快,公司业务可能过一段时间就会发生很大的变化,对中小团队来说,一次性做一个大项目或者买断一个软件,将产生非常高的沉没成本,而云服务的方式可以为业务提供灵活的支撑,冯智超坦言:“虽然云服务单价成本可能会高一些,但是拉长来看的话,周期的成本,云服务肯定是低于一次性投资项目的。”

  基于在线表单工具的产品特性,金数据选择了阿里云CDN、短信邮件等服务。阿里云CDN通过全球3200+节点及智能调度系统,让用户可以就近访问海量静态资源,毫秒级响应。阿里云国内短信支持三网合一专属通道,电信级运维保障,在阿里云产品支持下,金数据服务稳定性显著提升,可靠性 SLA达到 99.95%以上。

  冯智超认为,除了产品服务能力,更重要的是,在云市场还没有成熟的阶段,阿里云的品牌背书为业务开展提供了很大的便利:“当时的一些用户,对云服务形式的隐私安全有很大疑问和顾虑,我们需要和SaaS所有的云服务商一起去完成用户的教育。阿里云作为行业的领头羊,能够提升用户对产品安全隐私方面的信心。”

  稳定的云服务支持让金数据实现了产品功能的完善和用户的突破增长,用户可以通过金数据,实现调研、预约、登记、获客、抽奖、投票、考试、订单等场景功能使用。金数据表单高度自定义的功能模块,还可以帮助用户轻松搭建业务流程线上系统,无需开发。至今,金数据为来自各行各业的中小及头部企业、高校及研究所、政府单位等组织提供线上数字化平台搭建服务。

  在此基础上,金数据推出的“浩客HowXM”产品,针对企业用户,提供应用调研、评价、通知工具,用户只需要嵌入一段简单的代码,就可以在自己的APP内智能生成问卷。随着云服务的进一步成熟,“浩客HowXM”基础设施都布置在了阿里云上,据冯智超估算,通过使用阿里云ECS、数据库、消息队列、对象存储、CDN等服务,“浩客HowXM”整体成本降低了50%左右。

  在服务企业用户的过程中,冯智超和团队察觉到AI考试系统是一个充满机会的赛道。当今很多企业或者组织,都面临着高频率的知识和技能的更新。他们需要一个工具来确保团队成员可以不断提升专业和知识技能。在过去,企业需要专门的人员来负责培训,根据新的知识文档来准备试卷。

  冯智超分享了一个客户案例:一个负责企业安全生产的用户,每个月都需要组织全公司的安全生产培训考核。在之前,企业需要手工的把培训考试的题目,一道题一道题地添加到金数据中,虽然提供了通过 excel导入的功能,但是按照规定的格式创建excel并且录入好几百道题,可能就需要花一周的工作时间。“事实上,在我们之前的金数据产品中,在线考试已经是一个非常重要的应用场景。”团队选择了“智能出题”这个最小最有效的点来做创新,希望利用大模型能力,实现出题效率的提升。但在2023年,大模型技术受到关注的初期,这个尝试失败了。

  “AI在To B领域的落地更复杂,要求也更高。”冯智超分享道,客户可能需要一次性导入500道题的题库,大模型需要高准确度地完成文本切分,同时面对千差万别的数据格式,需要准确地将非结构化数据转化为结构化数据,“这对大模型指令遵循能力、上下文理解能力、逻辑能力都提出了很高要求。”当时的大模型技术并没有交出让团队满意的效果。

  “今年,随着AI技术特别是大模型的进一步成熟,通过大模型提升AI考试的效率变得非常有价值。”借助阿里云通义大模型,冯智超和团队希望打造的AI Native产品“金数据AI考试”,得以实现智能功能的落地。

  具体来说,“金数据AI考试”通过大模型 Prompt Engineering创建了 Data Extraction能力,并建立自动化评估机制,用来迭代提升 LLM的输出质量并建立回归体系,将用户任意的文档(非结构化数据)转换为在线题库(结构化数据);通过使用 Long Context和文本的 split/chunk来提升出题的数量,解决大模型输出 max_token的限制;对于新的知识点(基础模型训练后更新的数据),通过使用 Function Calling和 RAG技术,来增强题目的实时性和准确性,消除大模型的幻觉;通过 Agent技术,包括用户输入内容判断、网络搜索、不同场景出题的 Agent、题目质量检查等 workflow,增强整体出题的质量。

  最终,“金数据AI考试”可以实现一键导入文本、智能解析生成题库、30秒内自动完成出题组卷的智能化出题。“我们最快可以做到1分钟出400题,准确率100%。这在过去可能需要人工数天才能完成,并且准确率在98%左右,题目录入还需要花费成本。”冯智超表示,“通过AI大模型,我们真正实现了百倍甚至千倍的效率提升。”

  据悉,贵州某银行内部学习平台,使用“金数据AI考试”上传《洗钱和恐怖融资风险管理办法》生成考试题目,万字文档,AI出题只需两分钟。陕西某职业技术学院导入党纪学习相关文本资料,AI自动生成题库,组织“党纪学习每日答题测试”,使用系统半个月,1900+位考生共参与考试 3400余次。

  “对于AI来讲,还有一个挑战,就是如何落地。这可能也是行业内共同的一个痛点。”冯智超提到,今年,阿里云钉钉AI的发布会,提到了一个词是“AI Ready”,企业用户都是一个嗷嗷待哺的状态,知道 AI很强,但是不知道怎么能够用起来。“所以这次我们的 AI考试,也是一个可以直接提供落地的 AI ready产品。”冯智超和团队希望,“金数据AI考试”迈出AI落地应用的第一步,拉近用户和AI的距离。

  为此,“金数据AI考试”特别强调用户可以快速上手,作为一个 SaaS产品,直接做到了在线产品,用户注册后就可以理解体验智能出题等能力,并且推出了一个小程序,移动端的用户也可直接使用,快速体验到AI带来的能力。

  对于To B领域来说,AI带来了两个全新的优势:内容创造和新的交互方式。对于现有用户来说,这将大幅提升效率。更重要的是,它可以帮助企业接触到之前无法触及的用户群体。

  冯智超表示,“金数据AI考试”的未来规划也将围绕这两个关键点展开,“对于我们来说,在能提升效率和真正解决用户痛点的地方,我们会加入 AI的创造力和交互能力。对于 AI考试来讲,它不仅仅是智能出题,未来可以提供更多的是个性化学习、自适应的学习系统。”

  一切的实现,依然离不开大模型技术的进步。冯智超并不避讳,现在的大模型功能还未尽完善,开发者需要结合通义大模型和自身的工程解决方案,这使得最终产品要达到优秀的体验和交互仍有一定难度。展望未来,大模型承载了更多的期待:“现在,像千问这样的通义大模型,已经在很多方面改变了我们的开发和业务模式。但展望未来,我们希望在更多场景中看到更深入的应用。我们期待它们在指令遵循、逻辑理解和上下文处理能力上都有更大的进步。这样,我们作为SaaS产品提供商,就能进一步提升我们的产品实力,让用户体验更加出色。”

  在金数据参加的第五季阿里云Create@AI创客松大赛中,更多企服赛道企业表达了同样的期待和创新热情。决赛现场有投资人表示,入围企业的状态,仿佛让人看到了大众创新时期的蓬勃状态。期待在阿里云和众多创新者的共同努力下,更多AI应用带来更多创新惊喜。


竞博job 上一篇:行测题库:行测资料分析模拟题202474 下一篇:【2023年网络安全宣传周】十个方面100个网络安全相关知识点快来学习!