“企业数据大多杂乱无章,单靠人工难以整理,寻找规律。”
◆ 开数科技创始人熊梓锴
文| 铅笔道 记者 汪晨
►导语
在罗兰贝格咨询公司、Bayer医药集团做战略管理等工作时,熊梓锴需要查询、分析大量企业内部文档、数据,并整合海量的外部数据。但它们不仅难收集,且大多结构多样、杂乱无章,难寻规律。
2016年3月,他与剑桥校友Samuel Lee创立开数科技,以自然语言分析处理等技术为基础开发工具,自动分析企业非结构化数据(全文文本、图象、声音、影视、超媒体等信息),挖掘其中价值。
9月,开数科技推出“朗录”日志管理 SaaS 系统,收集、分析各类系统日志后,提供商业智能分析、IT 运维分析等功能,供企业 IT 运维人员、管理者查看。
目前,多家客户付费试用该系统,试用客户留存率约有80%。
注: 本文根据采访录音整理,铅笔道已备份录音速记,为内容客观性背书。
已是凌晨四点,办公室内,熊梓锴托着下巴盯着Excel 表格,期待着鼠标图案从沙漏变为指针,计算出结果。然而每隔几分钟,他都要调整参数再次计算,如此往复。
过往做战略管理工作中他发现:企业留存的数据、文本档案大多杂乱无章,大多属于非结构化数据,单靠人力很难从中寻找到规律。即使数据有一定结构,它们也极为庞大,常用的计算工具例如Excel难以胜任。
和同行业的朋友聊天,熊梓锴发现,这类现象十分普遍。展开思考后,他有此设想:如果有一款软件能整合所有数据来源,并直接分析出想要的结果,省去繁复的步骤。“如果有,那企业付费的意愿肯定很高”。
2015年冬,机场附近的酒店,熊梓锴见到了他的剑桥校友Samuel Lee。在麻省理工大学的 AI 实验室 CSAIL,Samuel Lee曾运用人工智能技术分析非结构化数据。
过去十余年间,两人经常的讨论该技术的原理与应用场景。
熊梓锴认为,经过深度学习,自然语言识别处理技术能从文字中提取语义,语义积累能够形成知识图谱。“就像一个人读了大量资料后,做出一套有系统逻辑的笔记,而大家都能看懂,还能查看细节的知识点。”
在他看来,这一技术是解决问题的钥匙。经过技术处理后,企业员工更容易从杂乱无章的企业数据、文档中寻找规律,做出决策,“非结构化数据也不再被抛弃,而能够被人所用”。
当晚他们决定创立开数科技,将这一技术应用在企业大数据领域,提供一套软件,分析企业非结构化数据。
但他们需要寻找切入点。企业数据类型众多,“机器可能只知道每个字的意思,但每句话的含义不一定了解”。而企业的需求十分庞杂,如何选择?
两人从各行各业挑选数十人交谈后发现,物联网服务器的日志数据多,且类型介于半结构化和非结构化之间,“以我们的技术能力能够应对”。他们决定从物联网服务器数据入手,开发服务器日志管理平台。
2016年9月,开数科技推出“朗录”SaaS 系统。花费5分钟设置后,系统自动清洗、分析服务器日志,并生成多张图表,供企业 IT 运维人员查看。“如果需要查看特定日志,几秒内能从百亿条数据中搜索到。”
◆“朗录”系统界面截图及技术说明
目前,已有多家种子用户参与试用。试用后,约有80%的客户留存付费,按照流量多寡计算费用,一年支付一次。
/The End/
编辑 薛 婷 校对 杨雨晨
联系创业者
进入个人中心-联络人,即可查看请求结果
您还未认证身份,暂时无法和ta联系!请尽快前往个人中心进行创投认证哦。