-
数据分析
数据分析和协作平台 Data.World 获 1400 万美元 A 轮
7月11日,数据分析和协作平台供应商 Data.World 宣布完成 1400 万美元的 A 轮融资,共有超过 24 家天使轮投资者参与了本轮融资,由 Shasta Ventures 领投,Capital Factory、 Chicago Ventures、Floodgate、FYRFLY Venture Partners 等参投。
Data.World 公司最初创立于 2015 年 12 月,在经过了八个月的隐身模式运行后,公司于昨日宣布正式启动。该公司是一家公益机构,总部位于德克萨斯州奥斯汀,通过100% 的投资者支持来实现业务增长、IPO 及进一步发展,从而创造社会价值。公司的主要业务是利用公司软件设计帮助用户迅速、轻松地找到数据,进行准备和共享工作,然后利用数据来实时协作解决最复杂的学术、商业和社会问题。Data.World 致力于成为全球最有意义且拥有最丰富数据资源的协作平台。公司的创新式企业结构有助于其在全球数据民主化使用及可持续性档案创建方面发挥作用。
Data.World 的联合创始人兼 CEO Hurt 表示:“开放数据也就是说任何人出于任何目的都可以自由使用、修改和共享数据,这一数据开放运动将被塑造成为当今人类最重要的影响力量之一。这项运动能够加速癌症治愈进程,保持政府问责,遏制气候变化并且对其他世界性问题施加积极影响力。我们创建 Data.World 让专业和业余的科学家、分析师和研究人员能够即刻查找、使用和共享数据,就是为了促进数据公开领域能够取得突破性进展。”
Jason Pressman 是 Shasta Ventures 的合伙人,同时也是 Data.World 董事会成员。他说道:“每隔两三年,你就能发现一个可以引发巨大变革的公司和想法,Data.World 就是这样的一个公司,它有这样一种潜力,能够重新定义在我们有生之年可以实现的一些可能性,并且为社会创造巨大的价值。”
目前 Data.World 开放数据集超过 1800 万,比谷歌网站推出数量的 7 倍还多。在数据共享和合作潜力的驱动下,研究人员、企业、政府、非政府组织和公民将向大众开放新的数据集,使更多地数据集逐渐为大众所用。
然而,寻找数据、理解数据意义并利用数据仍然是极其困难的一件事。在所有的开放数据中,只有不到 10% 的数据可被机器读取,平均一个项目 80% 的时间都花费在为数据分析进行相关准备工作上。需要进行协作的数据项目是很有难度的,因为它在数据持有者和数据需要者之间创建了一个数字鸿沟。此外,有一部分人希望能够通过安全结合企业内部数据与开放数据的方法来强化企业内部数据,事实上,他们几乎没有办法来实现。总体来看,这些技术和社会障碍使得开放数据难上加难。
本文来自翻译:www.pehub.com
-
数据分析
销售数据初创公司 LeadiD 获1000万美元B轮融资,更名为Jornaya
Jornaya是一家销售数据分析初创公司,前身为业界熟知的 LeadiD。今天该公司宣布获得 1000 万美元 B 轮融资,领投方是Edison Partners。
作为 Jornaya 的前身,LeadiD 提供一个独立、中立、开放的销售数据预测分析技术平台,企业可以利用这个平台追踪每一个销售引导事件的历史记录。LeadiD 平台非常重视供应商的数据安全,不会暴露敏感数据。但是,他们可以基于明确的原始和历史销售数据,帮助销售引导买方和销售引导卖方制定实时决策。LeadiD 打造了一个交易信任环境,在他们的平台上,销售引导买方和销售引导卖方都能获得最有效的价值。不仅如此,LeadiD 几乎算得上是销售数据分析的行业标准,不管是什么规模的企业,如果想要获得销售引导服务,LeadiD 平台绝对是不二选择。
更名之前,LeadiD 公司曾募集到总计 970 万美元融资,其中包括一笔由 Comcast Ventures 领投的 700 万美元 A 轮融资。
更名之后,该公司透露:
Jornaya 的预测分析平台将继续在企业品牌业务拓展中扮演重要角色,为企业客户提供消费者购买记录实时分析,提升客户获取产出。
本文编译自:venturebeat.com,如若转载,请注明出处:http://36kr.com/p/5048832.html
-
数据分析
创业公司如何构建数据指标体系?
对于从 BAT 等互联网公司出来的,已经经历了数据分析的历练,会有一个做事情看数据的习惯。而对于毕业之后就创业,或者是产品经理或运营专员新手,一般会对构建指标体系比较困惑,不知如何下手。甚至有些在微信公众号后台或者百度统计后台看到的几个指标,就觉得算是有了数据指标体系了,但又会发现与许多实际的工作脱节。我这里给大家介绍两套构建指标体系的方法,第一关键指标法和海盗指标法。
第一关键指标法
现在我问你一个问题,对你所负责的产品来说,最关键的一个指标是什么?我尝试问过一些人,特别是同一个公司的几个人,你会发现他们冒出来的第一关键指标是不同的。当然,这还不是最惨的,更惨的是根本就找不出来关键指标。对于一个大公司来说,比如像百度,因为产品很复杂,有很多的产品,即使同一个产品,也有不同的职能部门,他们会有不同的关键指标或者 KPI,情有可原。但对于一个创业公司,尤其是刚成立的初创公司,几十个人的团队都不是围绕同一个目标努力的,那问题就比较严重了。
第一关键指标法是在《精益数据分析》(Lean Analytics)一书中提到的方法,这个方法不是说一个公司用于只为一个指标负责,而是说在任意一个时间点,肯定只有一个最关键的指标。随着业务的发展,你的关注重点会有变化。我对第一关键指标的方法又做了一个延伸,关键指标又可以衍生出许多其他的指标。比如对于一个成熟的电商产品,它最关心的可能是销售额。但销售额我们又可以衍生出访问量、转化率、客单价等指标,我们通过优化这些衍生指标,来实现关键指标的增长。对公司来说,基于关键指标制定目标。
这样做的好处有两点:一是确定了现阶段的最重要的问题,二是可以基于关键指标的当前的状态,制定清晰的目标。否则你可能问题没找对,努力达到的数字也是没有意义的。
对于一个创业公司,不同的阶段需要关注的重点是不同的。我把创业公司分成三个阶段:
1、MVP 阶段:
MVP(Minimium Viable Product,最小可用产品) 是《精益创业》(Lean Startups)一书中提出的理念,在创业的最早期,你的关注点是确定用户需求,并做出一个最小可用的产品来验证需求的真实性。大量失败的创业最后发现解决的是个伪需求,为一个不存在的需求做出了一个不需要的产品。更好的方式是用最小的代价满足需求,然后再想更高效的方法去优化它。在这一阶段,数据分析的价值比较小,你需要的是定性分析,通过用户访谈,直接确定产品的满足情况,并不需要在数据分析方面投入大量工作。
2、增长阶段:
这个时候你的产品已经出来了,并且有用户在用,是时候需要做数据分析了。这一阶段我又把它分为有重叠的两个阶段:留存阶段和引荐阶段。我们在推广产品之前,一定要确认我们的产品确实是能够给客户带来价值的,并且有比较好的体验。那怎么确认这一点呢?除了直接听用户反馈之外,最重要的就是看用户的活跃度了。这里我们就需要做留存分析,比如看次日留存,如果发现你的用户次日留存率非常低,那说明根本吸引不住用户,还是要先优化产品。
等产品优化做的差不多了,我们就要进入引荐阶段了。一个好的产品会说话,最直接的就是口碑力量。对有些产品来说,它天然的带有病毒性质。比如,PayPal 的一个用户向朋友转钱,那么就会促使朋友也注册 PayPal。你可以通过人工的方式促进这一传播速度,比如 PayPal 每引荐一位朋友注册,可以得到 10 美元的奖励。这里需要关注的是 病毒系数 和 病毒周期,如果一个用户会推荐两个用户成功注册,那么这个病毒系数就是 2,如果这是经过 1 年才做到的,那么病毒周期就是 0.5 年了。
当然,并不是每个产品都能找到病毒传播的途径,找不到也没关系,我们还可以通过口碑。就拿我们来说,我比较关心的是 NPS(Net Prompter Score,净推荐值)。假设我们有 100 个客户,这 100 个客户中,有多少是给我们推荐了新客户的,有多少只是自己用的,有多少是通过私下或公开途径对我们进行负面评论的。拿推荐我们的减去否定我们的,就是 NPS。一个好的产品,NPS 应该在 50 以上。比如微信,说微信不好的很少,如果你的朋友没有在用,你会直接推荐他用,所以 NPS 会非常高。在 2006 年的时候,360 安全卫士刚出来,我真的觉得很好,以至于只要有亲朋好友的电脑有垃圾插件,我就推荐他们装一个,当然,我现在已经很久没推荐它了。
3、营收阶段:
这个阶段产品已经相对比较成熟,我们考虑的重点就变成了如何赚更多的钱,以及如何规模化。我们关注的重点成了 LTV(Life Time Value)、CAC(Customer Acquisition Cost)、渠道分成比例、渠道用户盈利周期、成本等。一般到这个阶段,创业公司就不再那么有趣了,最大的乐趣可能是获得量级上的增长。这个时候公司就需要寻找一些新的方向,为下一步增长做准备,而新的方向,又可以重复这三个阶段。
当然,我这里只是列举了不同阶段的典型关键指标,对于你的项目本身,还是要具体来看。比如,对于百度知道这个产品,因为属于百度搜索的子产品,它本身并不需要太关注盈利的问题,所以现在依旧还处于增长阶段,只是产品已经比较成熟了。接下来我分享一下我在加入百度知道后,寻找第一关键指标的经历。
2007 年我毕业后加入百度知道做后端研发。作为 RD,我每天也收到一系列报表邮件,这些报表里面有很多统计的一些数据。比如,百度知道的访问量、检索量、IP 数、Session 数、提问量、回答量,设置追加答案的数量,这一系列指标。当时,看的其实感觉很模糊。
我在思考:这么多的指标,不能说这也提高,那也提高吧?每个阶段肯定要思考哪个事最关键的,重点要提高哪些指标。开始的时候其实是没有任何区分的,不知道什么是重要、什么是不重要。
后来,慢慢有一些感触和认识,就发现其实对于访问量、检索量这些指标并没那么重要。因为百度知道大部分流量都是来自于大搜索,把它的展现做一下调整或者引导,对量的影响非常大。虽然,跟百度知道本身做的好坏也有直接关系,但是它很受渠道的影响——大搜索这个渠道的影响。
提问量我认为是非常重要,提升提问量,那么整个百度知道平台的问题就多了。提升回答量,让这些问题得到回答,高质量的内容就非常多了。提问和回答都很重要,都要发力,这让我很困惑。
有一次产品会,我就问当时的产品负责人是孙云丰,可能在百度呆过的或者说对百度产品体系有了解的都会知道这么一个人,非常厉害的一个产品经理。我当时就问了他这个问题,我对提问量、回答量都要提升这个困惑。
他就说了一点,其实提问量不是一个关键的问题,为什么?我们可以通过大搜索去引导,如果一个用户在大搜索里面进行搜索,发现这个搜索没有一个好的答案,那就可以引导他进行一个提问,这样其实这个提问量就可以迅速提升上去。
我一听一下就解决了这个困惑,最关键的就是一个回答量,我所做的事情其实怎么去提升回答量就可以了。
这里面把百度知道这个产品抽象成了最关键的一个指标——那就是如何提升回答量,在这个问题上当时做了一个事情就是进行问题推荐,根据用户的历史回答记录,或者是检索或浏览过的页面记录,给用户推荐感兴趣的问题,整个项目做下来提升了 7.5% 的回答量,是我非常有成就感的一个项目。
海盗指标法
2007 年,500 Startups 创业孵化器的创始合伙人 Dave McClure 针对创业公司应该关注哪些指标,提出了一套模型—— Pirate Metrics,即海盗指标法。他将创业公司需要关注的指标归结为五个方面:Acquisition(获取)、Activation(激活)、Retention(留存)、Revenue(营收)、Referral(引荐),简称 AARRR!。这一抽象经典的以至于过了 9 年了,都一点还不过时。Dave McClure 曾经是 PayPal 早期的营销总监,算是 PayPal 黑帮的代表人物之一,后来又是 500 Startups 的创始合伙人,有过成功的打造产品的经历,又指导过众多创业团队,能总结出这么牛逼的方法,也算是情理之中。网上的许多材料都是把这五个方面画成一个漏斗形状,以至于一些人理解这几块是顺序进行的,这是错误的。我也看了他在今年接受的一个采访,专门强调了这个误区。这一方法相比第一关键指标法,阶段划分更加清晰,但因为 Dave McClure 是营销出身,所以侧重点都在如何做营销方面。
我把这五点分为三个方面:
1、拉新:
首先是触达用户(Acquisition),让用户知道你,然后才可能选择你。之后是激活(Activation),一个用户到达你的首页,并不标明他就是你一个真正用户了,他可能成功注册,或者访问超过 10 个页面,才定义为激活。然后是引荐(Referral),一个好的产品,应该是自传播的,通过口碑,有越来越多的人使用。或者是通过一些激励措施,让老用户拉新用户。许多 Growth Hacking 的案例,都是在强调如何发挥引荐的威力。
2、留存:
在做好留存之前,最好不要花太多的功夫拉新。如果你的产品不能解决用户的问题,或者用户体验不好,那么拉的人越多,流失的越多,就像猴子掰玉米。留存就是要提升核心用户的重复频率,比如电商产品的复购,比如考察用户的次日留存率。
3、营收:
创业公司的最终目的都是为了赚钱,不是为了做慈善。就像百度如果不做竞价排名,也不可能有今天。如果一个产品有大量的用户但赚不了钱,那是很难持久的。比如我从 2011 年就开始用 Evernote,它是一个非常好的产品,但它即使天天推荐我升级为付费用户,我依旧没有动力。去年 Evernote 被唱衰的比较多,被认为是一个要倒掉的独角兽,CEO 都辞职了。烧钱可能能持续一段,但最终要实现正的增长。我介绍过他们如何像高交易量卖家收费的转型故事,非常成功。
下面这张图,描述了这五个环节的相关工作,我这里就不详细展开了。
而这里的每个环节,都会有一些需要衡量的指标。
表格里的指标都是和网站访问相关的,只是用于做参考,对于你的特有业务,还是需要具体问题具体分析。
本文作者桑文锋,神策数据创始人 & CEO,前百度大数据部技术经理。
来源:36氪
-
数据分析
GrowingIO获得2000万美元A轮融资,在无埋点的基础上强化实用场景
今日,GrowingIO在北京召开发布会宣布,已经获得 2000 万美元 A 轮融资,投资方是经纬中国、NEA、Greylock。此前在 2015年8月,其获得过经纬中国、Greylock、NEA 的 220 万美元天使轮融资。
GrowingIO 成立于 2015年5月,创始人张溪梦是原 Linkedin 商业分析部高级总监,曾被美国 Data Science Central 评选为 “世界前十位前沿数据科学家” 。他创办 GrowingIO 的目标是为互联网企业提供方便高效的数据分析服务,从而令企业做到数据驱动,提高商业运营效率。
GrowingIO 从数据采集技术切入,最大的亮点是不需要开发人员埋点,就可以详细地收集用户的数据。得到数据之后,GrowingIO 的分析师会根据数据,帮助客户梳理业务上的问题,提出可能适用的数据分析模型。当客户的运营、销售或者数据科学家熟悉 GrowingIO 系统之后,便可以根据 GrowingIO 采集的原子级别的数据,挖掘出更多的数据分析应用场景,比如提升用户转化率、减低客户流失率和深刻理解客户分群等。
此外,GrowingIO 还发布了 V2.0 版本,在无埋点技术和全量实时的数据分析功能的基础上,GrowingIO 全新上线了更精细的漏斗对比、用户细查、热力图等实用功能。
此前国内虽然有 GA、百度统计、友盟等数据分析工具,但是这些工具更偏重于页面访问量、活跃用户量、新增注册用户、交易数量以及支付成功率等基础指标,但无法支持更精细的数据分析,想要了解每一个用户在哪一个环节流失、用户的转化效果、用户属性等都需要埋点才能实现,而埋点不仅操作麻烦,还有漏埋和错埋的风险。
张溪梦强调,GrowingIO 新版产品能够呈现用户行为的每一次点击、每一次跳转、每一次登录等全量、实时用户行为数据,并在此基础上,可通过用户分群、漏斗对比等功能,分析不同访问来源、不同城市、不同广告来源等多维度的不同转化细节。
产品经理、市场运营人员不再只看到表面整体转化率,还能看到了解转化过程中每一处细节,帮助其在第一时间找到转化突破点和优化点,以此改进产品体验、调整运营策略。
据悉,GrowingIO 已有 1000 多家客户,其中包括点融、人人贷、普惠金融、唯品会-乐峰、北森、销售易、环信、明道、猎上、名片全能王、回家吃饭、下厨房、Camera360 等近百家付费客户,涵盖互联网金融、O2O、电商、SaaS 等网站和 APP 客户。
发布会上,经纬中国创始管理合伙人邵亦波也到场,他表示,“用户行为数据驱动运营,将成为互联网领域的水电煤,价值巨大。在硅谷,这已是 LinkedIn、Facebook 等业内巨头的标配。同时美国同类型创业公司 Mixpanel、Optimizely 等企业也很快成为 10 亿美元量级公司。而在国内,随着互联网红利逐步衰减,精细化运营也成为互联网行业关注的重点。 ”
原创文章,作者:徐宁,如若转载,请注明出处:http://36kr.com/p/5048713.html
-
数据分析
数据分析平台ASO114获200万元种子轮融资
App推广数据分析平台ASO114获200万元种子轮融资,投资方为个人。
ASO114是一家App推广数据分析平台。致力于为用户提供免费分析工具,帮助客户自动化处理繁杂的数据。
ASO114的核心内容就是ASO优化,通过24小时不间断追踪超过400万款应用最新数据动态,为开发者提供最准确和权威的ASO数据分析服务,提升其App曝光度,降低推广成本,最终获得更多精准用户。ASO114向用户提供榜单实时排名、完整的实时热搜词和关键词搜索指数排行、竞品对比数据、用户评论走势等,对App进行更具体完整的ASO数据分析,同时分别提供一键式优化助手和定制化的ASO专家服务,帮助创业者进行专业的ASO优化。
ASO114的盈利模式很清晰,一是平台服务费;二是深度分析报告付费可看,比较竞品分析报告这一类;三是提供定制化服务,和企业合作全权受委托做优化服务;最后是定期举办的线下深度沙龙培训的学费,面向愿意学习相关基础技术的人群。当前正通过全国性的落地沙龙扩大知名度和影响力。
团队现在有25个人,技术板块12人,但他们的理念是全员销售,因为他们认为技术和商务理念完全隔离打磨不出好产品,也不利于对外传播。团队的联合创始人共有4位,品牌营销和技术人员都有。这个项目的发起人其实就是搜索技术行业出身,有多年技术经验,他认为SEO红利已过,所以转向ASO寻求全新的机遇。
来源:思达派
-
数据分析
Oracle以5.32亿美元收购节能数据分析公司Opower
据华尔街日报报道,软件巨头 Oracle 已同意以每股 10.3 美元共 5.32 亿美元(较早前路透社的消息是 5.48 亿美元)的价格现金收购利用数据分析帮助用户节能的云服务提供商 Opower,与上周 5 收盘价相比,这个价格溢价了 30%。
Opower 是一家创办于 2007年 的能源数据分析公司,其目标是帮助家庭用户实现节能。Opower 可以在不需用户安装任何智能设备的情况下,便可得知家庭中制冷、制热设备每天消耗了多少电能(从电力公司拿到的数据)。同时 Opower 还可以让用户看到邻居们的用电账单进行比对,从而在比较重促进节能行为。通过这些举措,Opower 帮助用户实现了平均 1.5%-3.5%的节能效果,同时由于用户可以实时了解用电情况,从而避免了不必要的浪费。2014年Opower 已经实现了上市。目前 Opower 的云服务拥有 6000 万用户,分析的电表读数超过了 6000 亿次。
Oracle 本身此前已经涉足电力领域的业务,OracleUtilities 就是针对公用事业的云解决方案,可以为客户提供基于云的各种管理和分析功能。在收购了 Opower 之后,Oracle 在公用事业领域 SaaS 将少了一个强劲的竞争对手。
这是 Oracle 在 2 周内进行的第 2 项收购—上周的 4月28日,软件巨头刚刚以 6.63 亿美元收购了建筑工程云服务提供商 Textura。接连的举动表明 Oracle 有意进一步拓展垂直领域的云服务。同时这也表明,在 IaaS 与 PaaS 被 Amazon、Google、微软、IBM 等公司占据了大部分市场份额的情况下,Oracle 正视图通过收购垂直市场的云服务提供商来扩大在 SaaS 市场的影响力。
来源:36氪,作者:boxi,如若转载,请注明出处:http://36kr.com/p/5046576.html
-
数据分析
搜索难用、个性推荐不准?达观数据以此切入大数据服务
几乎每见一个创业者,我都会听到一次 “…,然后我们用大数据做用户精准画像 / 智能推荐 / 金融征信…”,其中有多少人举着大数据的旗、干着基础数理统计的事,大家心知肚明。
大数据背后的技术算法是核心,创业公司搭一个基础大数据的 “台子” 至少要请 4 个工程师,即使程序员的月薪降到 12k,也意味着每年至少 50 万元的成本。在创业初期,产品、商业模式都需要不断打磨、改善的情况下,分出精力和财力去做这件事,不一定划算。
所以这种服务交由第三方企业来做是趋势,但由于价格高、服务不容易产品化、标准化,导致不容易区分服务的水平。另外,一家第三方服务商在不同应用场景上也有不同的表现,做得好坏主要还是看应用场景以及是否能结合客户业务来提升其业绩。
最近刚刚拿到来自真格基金、众米资本和掌门科技集团1000 万元天使投资的 “达观数据科技(官网)”,主要的应用有三:数据挖掘分析、搜索性能优化、通过用户画像做精准推荐。同样以智能推荐为核心,较为成熟的国外公司是Taboola。
在数据采集方面,大数据公司通常会用爬虫抓取网络信息,并打通第三方应用 SDK、Java Script 接口来获取一些浅层数据,比如日活、月活、用户留存率等等。而除此之外,达观还要求其客户向其打通更深层的 js 数据,比如用户点击行为、收藏记录、付费记录等等。
在此之后达观为客户提供最基础的服务是数据分析,比如用户在应用搜索栏和个性推荐栏中的转化率分别是多少。该公司也推出了一个免费的 APP “达观公众号”,为微信公众号运营人员提供数据分析工具,希望以此积累数据和用户口碑。
而达观核心的应用场景则是搜索优化和智能推荐,前者如关键字补全、自动纠错、相关搜索、中英文自动串联识别,这些体验我们能在 Google、百度等搜索引擎中感知到,中小企业很难做好却又非常需要,这就是为何知乎要引入搜狗来提供搜素技术(知乎的搜索体验一直饱受诟病)。
智能推荐的应用也不难理解,早期以 Amazon 为典型的商品推荐算法用户早已司空见惯,比如用户在某电商买了辆自行车,随即便推荐坐垫、头盔等相关产品,常见的算法原理有 “与你类似的人喜欢什么” 以及 “从你喜欢的东西推测出你还会喜欢什么”。许多创业公司都是通过为产品打 tag 的方式强行关联相似产品,体验不一定好。
达观在引擎架构研发中使用到了点击模型,通过与用户的隐性交互如点击反馈,可以对结果进行调优:将符合用户偏好但位置靠后的 item 提取至前,或者将不符合用户意图的 item 降权减分。
以电商推荐系统为例,这里引用该公司技术人员江永青在其微信公号发布文章中的论述:
协同过滤算法中,如果没有显性的评分机制,就需要收集点击的行为来作为正向的评分。不同类型的点击(如查看、加购物车、加关注等)可以生成不同维度的二维相似度矩阵,最后推荐的结果由这些矩阵计算生成的中间结果加权得到。
不过江永青也表示点击模型存在一些挑战和难点,包括位置偏向、冷启动数据不足、感知相关性与数据无关、无法覆盖长尾点击数据、故意点击作弊、Session 手机难。
大数据服务的量化标准是为客户带来多少业绩提升,达观数据 COO 冯佳妮向 36 氪列举了一些案例,其中比较突出的是文学网站 “潇湘书院”,该公司根据用户浏览、点击、购买等记录做出一套新的推荐系统,较之前提升了 300%的下单购买率、85%的点击率,年费大概为几十万元。
达观数据自 2015年5月 创建、10月 上线达观公众号产品,至今已累计服务 8000 个自媒体用户。
而其面向大 B 客户的服务则按照 SaaS 的形式收取年费,每笔从 20 万元至 200 万元不等。冯佳妮表示,已经在和一些电商企业洽谈数据打通事宜,比如某国内女性经期管理应用、同仁堂旗下的保健品电商品台,还有一家 FA 机构。该公司也将于今年上半年和复旦大学计算机学院合作组建 “大数据实验室”,与科研机构联合做政企服务,相关政府单位已经提出文化场所选址规划、管辖范围内企业运营情况分析等需求。
做企业深度服务的订单周期较慢是正常现象,但达观面临的主要问题还是如何获得更多客户,不得不解决的问题有两个:
需要提供统一接口,满足普通企业的基础需求,客户提出个性化需求后只需做简单的改动而不用重头再来。冯佳妮表示未来希望做成类似云服务的产品,让客户按需选择服务。
目前达观团队有 20 余名,因人手不够的问题只好将一些找上门来的客户暂时搁置,即使该团队有不少技术大牛,但人才稀缺是不得不考虑的问题。
达观数据成立时间只有 7 个月,核心的三位联合创始人全部出自盛大:
CEO 陈运文为复旦大学计算机博士,曾担任盛大文学首席数据官,腾讯文学高级总监、数据中心负责人,百度核心技术研发工程师,国际计算机学会(ACM)会员,中国计算机学会(CCF)高级会员,在国际顶级学术期刊和会议上发表多篇 SCI 论文,多次参加 ACM 国际数据挖掘竞赛并获得冠军荣誉;
CTO 纪达麒为原腾讯文学数据中心高级研究员、盛大文学技术总监等职务; 原搜狗广告技术部和百度技术部高级工程师;拥有北京邮电大学计算机硕士学位;
COO 冯佳妮为原盛大云计算公司运营总监、安普丹华国际咨询公司高级咨询师,多次获安普丹华公司 Top-Sales 荣 誉;拥有山西财经大学工商管理和商务英语双学士学位。
注:该团队正在招募各类人才,有意者可联系 Hr@datagrand.com
原创文章,作者:暮雨,如若转载,请注明出处:http://36kr.com/p/5042353.html
-
数据分析
在公开信息中寻找蛛丝马迹,“风报” 要利用数据分析为企业提供情报
在关于企业信息的数据供应商中,我们曾报道过一款企业信息查询工具 “启信宝”,这家诞生于去年3月 的产品在六个月的时间里,从一个微信服务号扩充至 iOS、Android、Web 客户端,并于 9月 份获得 3000 万融资,目前已涵盖了全国 7500 万家企业的信用信息。
在占据行业领头羊地位相当一段时间后,启信宝要面临另一位竞争者的异军突起。在去年9月15日,也就是在启信宝刚刚获得新一轮融资的时候,另一款基于政府公开信息、媒体信息、社会信息的企业情报系统 “风报” 正式发布。
和启信宝通过征信中心与连接相关征信网站数据接口的获取方式相比,风报对企业信息的搜集则是依托了它们前期建立起来的核心自然语言分析技术 “玻森数据”,利用散落在全网中的企业外部文本数据,从海量的企业事件角度切入,展现企业及其管理者的情报,挖掘潜在风险。
在风报的创始人及 CEO 李臻看来,仅仅用 “企业数据查询” 来描述风报的功能有些单薄,他们更愿意用 “企业情报分析” 来形容这款系统,事实上,风报的诞生也不是一蹴而就的。2012年4月,风报的母公司玻森数据上线了全套 NLP(Natural Language Processing 自然语言处理系统)引擎及语料数据库,专注于自然语言处理技术的研发及应用,并使用这套系统为汽车、快速消费品等品类进行市场反馈、产品研发等方面的数据支持。
这听起来似乎很晦涩,但落实在现实操作中其实不难理解,玻森曾为大众点评上面的某个商家进行过口碑方面的典型意见分析,通过对非结构语言的转化以及词性色彩的判定,能够为餐厅提供在服务、消费场景、品牌个性、价格等方面的建议。
在玻森数据引擎的支撑下,李臻与其他合伙人进一步开发了风报产品,以面向企业信息查询这一垂直细分领域。在李臻看来,政府对公开信息的扩大化也是促进他们推出风报系统的另一点原因。
“有 80% 的商业情报都以非结构化的自然语言文本形式存在于网络的各个角落,但没人处理这些信息。” 李臻对记者说道,不论是政府公开信息,还是公司的热点事件,这些文本内容都夹杂在政府官网、新闻媒体、社交媒体等位置。
通过对非结构化数据的挖掘,风报要做得就是定位于工商、涉诉、税务、行政处罚、投融资、高管变动、企业经营业务等重大事件报道,对企业交易对手、竞争对手、合作伙伴、行业公司直接进行审查评估。
比如在风报系统中对乐视网信息技术(北京)股份有限公司进行搜索,页面中就会出现一栏非结构化事件的信息分类,一栏以时间轴分析事件分类的企业动态,这种多信源、跨数据源的信息聚合,能对企业在经营过程中的关联信息进行集中展示。
对于企业与企业、企业与个人之间的关系,风报还可以通过对司法文书的语义分析,得出隐藏在他们背后的关联体系,目前 “风报” 系统为用户提供三类关系的挖掘:分别是基于法律关系的多层企业投资及被投资关系;基于司法的企业与企业或个人间涉案关系;基于海量重大事件的企业间关系。
当谈及与 “启信宝” 的差别,李臻当即为我进行了两款软件的使用对比,在对某一公司的信息查询中,风报能够的法律文书信息为 730 条,而启信宝提供的信息数量为 400 余条,另外,风报能够实现的时间轴、交叉系统展示也是启信宝暂时没有的。
不过,从目标受众来看,启信宝拥有更多的 C 端用户,其企业查询服务也为免费使用。风报则定位于纯企业端用户,以收取 5 万 8、13 万 8 至百万不等的年费实现营收,目前已积累了 400 多个企业用户。
目前风报已完成数千万级的 Pre-A 轮融资。团队方面,风报联合创始人李臻是一位连续创业者,在商务拓展与政府合作中积累了颇多资源;纪敏曾长期服务于知名咨询公司及上市公司,具有丰富的商业经验;另外两位联合创始人闵可锐、赵迎宾均毕业于知名高校,在海外深造后回国参与风报的技术团队打造和产品研发。
来源:36氪,作者:苏建勋,如若转载,请注明出处:http://36kr.com/p/5041817.html
-
数据分析
多维数据挖掘分析,Sensors Data想成为企业发展的动力源
来源:猎云网(微信:ilieyun) 文/马凤仪
此前Sensors Data在猎云网公布了天使轮的融资消息后,据创始人桑文锋反馈,文章发布后几小时,就受到了诸多vc关注,其中不乏有投资界的大佬。
接下来将着重介绍下Sensors Data的业务模式。
大数据的本质是一种数据驱动的理念外加技术,在数据源体量一般的情况下,就算没有复杂的技术,也能实现一些效果,但要想对体量庞大的数据进行多维度深层挖掘,就会面临一些技术上的挑战。
桑文锋在百度做了八年的数据统计分析工作,今年4月出来创立了Sensors Data。
桑文锋认为,数据人才对于创业公司来说又稀又贵,并且数据分析类产品建构并不是一两个人短时间就能完成的,所以他带领他在百度共事多年的伙伴做了一款数据分析工具Sensors Analytics(神策分析),其目的就是想要为创业公司提供专业的数据分析服务。
除了分析工具之外,Sensors Data 依托团队以往的大数据领域的技术和项目经验,也对外提供相应的技术咨询服务。服务的技术方向包括:
1、海量数据下的数据处理平台、数据仓库等大数据基础设施的建设和维护;
2、数据打印、传输、存储、建模、应用等数据实时和批量处理流程的构建、维护和调优;
3、基于用户数据的数据智能应用,包括用户画像、个性化推荐、用户生存周期分析、作弊用户识别等;
4、工业大数据领域方面,工业传感器的数据采集、传输、存储,以及相应的应用,包括数据的多维分析与可视化以及故障预测和诊断等。
提供的服务的形式包括: 相应领域技术专家的专业咨询服务;相应领域技术人员的培训;项目技术方案的设计和评审,代码的review;系统的故障辅助分析和排查,性能调优。
桑文锋强调:“Sensors Analytics是一款纯粹的数据分析工具,不会占有用户的任何数据。”他们既可以向普通企业用户提供Cloud版,也可以为对数据安全有顾虑的企业用户提供私有部署版。需要强调的是,桑文锋在向笔者演示多维度交叉分析的过程时,其反应速度已达到秒级。
与Sensors Analytics对标的产品已经有很多,国外的GA(Google Analytics)、MixPanel;国内的百度统计、友盟等。GA主要是通过用户访问情况和网站使用情况帮助企业衡量销售与转换情况;MixPanel主要针对用户行为分析而非访问量。与Sensors Analytics相比GA等产品只能覆盖前端JS/APP SDK记录的数据,是无法覆盖服务端和业务数据库的数据;从分析能力来说,国内GA类的产品只具备宏观分析能力,企业使用时并不能驱动企业运营以及个性需求。
于是,为了让数据发挥最大价值,在Sensors Analytics数据分析工具的基础上,他们又推出了数据咨询服务,已组建专业的资深数据分析团队,提供配套大数据咨询服务,咨询服务分为多维分析指标体系建设、事件设计及实施指导、数据分析和决策指导,其收费标准是5000~8000元/小时。此外,技术服务方面的收费根据数据量及业务复杂度来计费,价格在2~20万元/年之间。目前服务客户多为电商和O2O类创业公司,其中包括爱鲜蜂、多盟、AcFun、快快鱼、PP租车、51Offer等。
Sensors Data的技术团队一共有12人,大多来自百度。核心创始人桑文锋、曹犟、刘耀洲、付力力均来自百度大数据部,创始人兼CEO桑文锋2007年加入百度,从2008年底开始组建并带领团队,从零实现了百度用户日志的大数据平台,覆盖数据收集、传输、元数据管理、作业流调度、海量数据查询引擎、数据可视化等。他曾带领团队打造的系统有:LSP日志统计平台、Logdata用户行为查询平台、User Profile Service 1.0、User Data Warehouse 1.0、Biglog平台、Minos日志传输系统、LS 2.0作业流调度系统、Wing计算引擎、OLAP Engine等。
据了解,Sensors Data正在积极筹备下一轮融资。
-
数据分析
“日志易” 获红杉 6000 万人民币 A 轮投资,预计明年盈利
图片: Yestone.com 版权图片库
近日,“日志易” 获得由红杉资本投资的 6000 万人民币 A 轮融资。此前在 2014年3月 时,该公司获得过真格基金领投的 1400 万人民币天使轮融资。
此前报道过 “日志易”,技术部分不过多阐述。它对标美国的 Splunk(之前市值 100 亿美元左右,现在市值 70 多亿美元。),定位在做实时大数据的搜索分析引擎。通俗来说,操作任何计算机软件、IT 系统时都会记录一条信息,也就是产生日志。“日志易” 就是基于这些数据在做搜索、分析、可视化,可以应用在运维监控、安全审计、用户及业务数据分析等领域。举例来说:
运维监控,就是应用在系统出故障时可以及时定位问题的原因,常见场景包括访问数据、访问接口、软件系统内部核心链路、软件系统对其依赖系统的访问情况以及系统异常等。
安全审计,就是当企业遭受到攻击时都会在日志留下痕迹,日志分析能够协助 IT 人员实现网络故障排查、网络安全审计、安全信息与事件管理、日志统一归档等。此前日志易还给北京公安局以及公安部一所做过案例。
用户及业务数据分析,例如,用户在电商买东西时,查看的哪些商品、放进购物车的都会有日志记录。再例如,百度关键词投放,被谁点击了,停留的时常等,也都是通过日志计算出来的信息。
日志易的创始人兼 CEO 陈军强调,他们在做的事情,不仅要强调数据量大,更多的是需要速度够快,百度的搜索引擎只能搜索几分钟之前的信息,而日志易可以搜索到几秒钟之前的信息。
值得一提的是,日志易的创始人兼 CEO 陈军先后在思科、Google、腾讯和高德做技术高层。日志易负责市场销售的汤滨曾就职 IBM、SAP 和 Splunk 等企业的销售职位 。日志易的团队吸纳了来自腾讯、百度、阿里、360 等互联网公司的研发人才。
目前日志易的企业客户分两部分,一部分是需要私有云定制部署的大中企业,大概在 100 多家,包括中国平安、国家电网、中国移动、乐视等;另一部分是为中小企业服务的 SaaS 标准版本。预计明年公司可以实现盈利。
来源:36氪
作者:徐宁
出处:http://36kr.com/p/5040900.html
扫一扫 加微信
hrtechchina