• Indeed
    招聘网站Indeed调查:职业停滞促使女性脱离科技工作 文/DEAN TAKAHASHI 女性在科技行业的代表性仍然不足,招聘网站Indeed报告说,部分原因是未能留住进入该行业的女性。一项调查显示,女性离开科技工作岗位的首要原因是缺乏职业发展。 在接受调查的女性中,28%的人表示缺乏职业发展或轨迹是他们离开上一份工作的原因。 拥有计算机科学学位的女性比例实际上已从1984年的37%降至现在的19%。拥有科学,技术,工程或数学(STEM)学位的女性中,只有26%从事技术职业,而男性则为40%。 离职的第二个最常见的原因是管理不善,24.6%的受访者选择了这个原因。由于第三个最常见的原因(24.4%)受访者离开了上一份工作,因此工资增长缓慢。 相比之下,与生活方式相关的问题,例如工作与生活平衡(14%),文化适应性(12%)和育儿假政策不足(2%)是离职的常见原因。 (上图:女性离职后工作的主要原因) 事实上,许多技术女性认为男性拥有更多的职业发展机会 - 只有一半(53%)认为男性拥有与男性同行一样的高级领导角色。 在有子女或其他家庭责任的女性中,近三分之一(28%)认为他们因为是父母或有其他家庭责任而被放弃晋升。 薪酬位居榜首,是女性决定职位的最重要因素,三分之一的受访者选择薪酬。但透明度是一个问题--40%的女性表示希望雇主在面试过程中对工资“更加透明”。 一旦上班,薪水仍然是主要关注点。当被问及他们面临的挑战时,几乎一半的受访者(45%)引用了工资增长是最重要的回应。 这比那些认为偏见或歧视(23%)或性骚扰(12%)是挑战的人更多。 (上图:由于缺乏职业发展,技术领域的女性最有可能留下工作) 工资增长也是女性期望在职业生涯中最常见的挑战(33%)。 科技女性认为她们的报酬低于男性 - 几乎一半(46%)的受访者认为他们的报酬低于男性报酬。尽管认为薪资增长是一项重大挑战,但只有超过一半(53%)的科技女性认为可以要求晋升或加薪。 有什么可以改善这种情况?事实上,拥有透明的薪资信息,比如在工作描述中发布工资,可能会有所帮助。超过四分之三(76%)的科技女性表示,这将有助于他们确定并协商更公平的薪酬。 除了提高薪酬透明度之外,努力实现性别薪酬公平以及赋予妇女权力以寻求晋升和加薪也有助于留住人才。一个创造性的例子可以在The Motley Fool,一份财经通讯中找到,该公司最近向员工支付了200美元,要求加薪,以尽量减少性别工资差距。即使员工被拒绝,他们仍然收到200美元。 女性在技术领域对内部流动性的需求很高--61%的人表示,在某些时候,他们希望在公司内部转变为不同的角色。 在那些表示想要在内部转换角色的女性中,有80%的女性表示,如果有明确的方法,她们更有可能留下来。 健康保险是技术女性最重要的福利,37%的人选择它。第二个最受欢迎的是灵活的工作时间表(24%),第三个是奖金或定期加薪(19%)。 25岁至34岁的女性比任何其他年龄组都更难以闯入管理或领导角色(27%),偏见或歧视(25%)是他们在职业生涯中面临的最大挑战。然而,这个年龄组也比整个女性更有可能留下工作,因为团队不够多样化(27%,而所有女性都是23%),或者没有足够的女性领导代表(24%比较)所有女性的比例为20%)。Indeed在调查中调查了1000多名女性。   以上为AI翻译,内容仅供参考。 原文链接:Indeed: Career stagnation drives women out of tech jobs
    Indeed
    2018年11月07日
  • Indeed
    [纯技术] 工作职位推荐系统的算法与架构 Indeed.com 每个月有两亿不同的访客,有每天处理数亿次请求的推荐引擎。在这篇文章里,我们将描述我们的推荐引擎是如何演化的,如何从最初的基于Apache Mahout建立的最简化可用行产品,到一个在线离线混合的成熟产品管道。我们将探索这些变化对产品性能指标的影响,以及我们是如何通过使用算法、架构和模型格式的增量修改来解决这些挑战的。进一步,我们将回顾在系统设计中的一些相关经验,相信可以适用于任何高流量的机器学习应用中。 从搜索引擎到推荐 Indeed的产品运行在世界各地的许多数据中心上。来自每个数据中心的点击流数据以及其他应用事件被复制到我们在奥斯丁数据中心的一个中心化的HDFS数据仓库中。我们在这个数据仓库上进行计算分析并且构建我们的机器学习模型。 我们的职位搜索引擎是简单而直观的,只有两个输入:关键字和地点。搜索结果页面展示了一个匹配的职位列表,并基于相关性进行了排序。搜索引擎是我们的用户发现职位的主要方式。 我们决定在搜索引擎之上加入职位推荐作为一个新的交互模式是基于以下几个关键原因: Indeed上所有搜索的25%只指定了一个区域,并没有搜索关键字。有许多的求职者并不确定在他们的搜索中应该用什么关键字 当我们发送有针对性的推荐时,求职者的体验是个性化的 推荐可以帮助甚至最复杂的用户来发现额外的未被搜索所涵盖的职位 推荐为亚马逊带来了额外35%的销量为Netflix75%的内容阅览。很显然,推荐能提供额外的价值 推荐职位与推荐产品或者是电影有很显著的区别。这里列举了一些我们在构建推荐引擎时仔细考虑过的因素: (职位)库存快速增长:我们每天要聚合计算几百万新的职位。可以推荐的职位的集合在不断变化 新用户:每天有几百万新的求职者访问我们的网站并开始他们的职位搜索。我们想要能够根据有限的用户数据生成推荐。 流动性:在indeed上一个职位的平均生命周期是30天左右。内容的更新十分重要,因为老的职位的需要非常可能已经被满足了 有限的供给关系:一个发布的职位通常只招一个的应聘者。这和书籍或者电影很不一样,并不是只要有库存就可以同时推荐给很多用户。如果我们过度推荐一个职位,我们可能会让雇主收到到上千个应聘申请的轰炸。 如何理解推荐算法 推荐是一个匹配问题。给定一个用户集合和一个物品集合,我们想要将用户匹配到他们喜欢的物品上。有两种高层次的方法可以达成这类匹配:基于内容的和基于行为的。它们各有优缺点,此外也有将两者结合起来从而发挥各自优势的方法。 基于内容的方法使用比如用户偏好设置、被推荐物品的特性之类的数据来决定最佳匹配。对于职位推荐来说,通过职位的描述中的关键字来匹配用户上传的简历中的关键字是一种基于内容的推荐方法。通过一个职位的关键字来找到其他看上去相似的职位是另外一种基于内容的推荐的实现方法。 基于行为的方法利用了用户的行为来生成推荐。这类方法是领域无关的,这意味着同样的算法如果对于音乐或者电影有效的话,也可以被应用在求职领域。基于行为的方法会遇到所谓的冷启动问题。如果你只有很少的用户活动数据,就很难去生成高质量的推荐。 Mahout协同过滤 我们从建立一个基于行为的推荐引擎开始,因为我们想要利用我们已有的求职用户和他们的点击数据,我们的首次个性化推荐尝试是基于Apache Mahout提供的基于用户间的协同过滤算法的实现。我们将点击流数据喂给一个运行在Hadoop集群上的Mahout构建器并产生一个用户到推荐职位的映射。我们建立一个新的服务使得可以运行时访问这个模型,且多个客户端应用可以同时访问这个服务来获取推荐的职位。 产品原型的结果和障碍 作为一个产品原型,基于行为的推荐引擎向我们展示了一步步迭代前进的重要性。通过快速建立起这个系统并将其展示给用户,我们发现这种推荐对于求职者来说是有用的。然而,我们很快就遇到了一些在我们的数据流上使用Mahout的问题: 模型构建器需要花大约18个小时的时间来处理Indeed网站2013年的点击流数据,这个数据量要比今日的数据小了三倍。 我们只能一天执行一个模型构造器,这意味着每天新加入的用户直到第二天为止看不到任何推荐。 几百万新汇总的职位在模型构造器再次运行之前是不能作为可见的推荐的。 我们产生的模型是一个很大的映射,大约占了50吉字节的空间,需要花费数个小时将其通过广域网从其生成的数据中心拷贝到全球各地的数据中心。 Mahout的实现的提供露了一些可配置参数,比如相似度阈值。我们可以调节算法的参数,但是我们想要测试整个不同的算法这样的灵活性。 为推荐实现最小哈希 我们先解决最重要的问题:构建器太慢了。我们发现在Mahout中的用户间相似度是通过在n^2复杂度下的用户间两两比较的来实现的。仅对于美国的网站用户来说(五千万的访问量),这个比较的数量将达到15 * 10^15次,这是难以接受的。而且这一计算本身也是批量处理的,新加一个用户或者一个新的点击事件就要求重新计算所有的相似度。 我们意识到推荐是一个非精确匹配问题。我们是在寻求方法来发现给定用户最相近的用户们,但是我们并不需要100%准确。我们找了一些估算相似度的方法,不需要准确的计算。 主要贡献者戴夫格里菲思从一篇谷歌新闻学术论文上看到了最小哈希方法。最小哈希(或者最小独立序列)允许近似计算杰卡德相似度。将这一方法应用到两个用户都点击过的职位上,我们发现两个用户有更多共同的职位点击,那么他们的杰卡徳相似度就越高。为所有的用户对计算杰卡徳相似度的复杂度是O(n^2),而有了最小哈希后,我们可以将复杂度降到O(n)。 给定一个哈希函数h1, 一个项目集合的最小哈希被定义为将集合中所有项用该哈希函数分别哈希,然后取其中最小的值。由于方差太大,单个哈希函数不足以计算近似杰卡徳相似度。我们必须使用一个哈希函数族来合理地计算近似的杰卡徳距离。通过使用一个哈希函数族,最小哈希可被用来实现可调节杰卡徳相似度阈值的个性化推荐。 “挖掘海量数据集”,一个最近的由斯坦福大学教授莱斯科维克、拉贾罗曼和厄尔曼讲解的Coursera课程,非常详细的解释了最小哈希。他们书的第三章——“挖掘海量数据集”,解释了最小哈希背后的数学证明原理。 我们针对推荐的最小哈希的实现涉及到以下三个阶段: 1. 签名计算和集群分配 每一个求职者被映射到一个h个集群的集合,对应了一个哈希函数族H(下面的伪代码展示了这一过程): H = {H1, H2, ..H20} for user in Users for hash in H minhash[hash] = min{x∈Itemsi| hash(x)} 这里H是一个包含h个哈希函数的族。这一步的最后,每一个用户被一个签名集合所代表,也即一个由h个值组成的集群。 2. 集群扩展 共享相同签名的用户被认为是相似的,他们的职位将为被互相推荐。因此我们从每一个在集群中的用户开始,用其所有的职位来扩展每个集群。 3.生成推荐 为了给一个用户生成推荐,我们将h个用户所在的集群中的职位并起来。然后我们除去任何用户已经访问过的职位,从而得到最后的职位推荐。 为新用户推荐职位 最小哈希的数学属性使得我们可以解决为新用户推荐职位的问题,并且可以向所有的用户推荐新的职位。当新的点击数据到来的时候,我们增量地更新最小哈希签名。我们也在内存中维护新职位和他们的最小哈希族的映射。通过在内存中保留这两部分数据,我们就可以在新用户点击了一些职位后为他们推荐职位。只要任何新发布的职位被点击访问过,它就可以被推荐给用户。 在转移到最小哈希方法后,我们有了一个混合的推荐模型,由一个在Hadoop上的构建的离线每日被更新的组件和一个由当日的点击数据组成、在内存缓存中实现的在线组件。这两个模型被整合起来用以计算每一个用户的最终推荐集合。在我们做了这些改变之后,每一个用户的推荐变得更加得动态,因为它们将随着用户点击感兴趣的职位的同时发生变化。 这些改变中我们认识到,我们可以在性能和准确度上做出权衡,用小的误差增加来换大的性能提升。我们也认识到可以将较慢的离线模型通过在线的模型进行补充,从而得到更新的推荐结果。 工程基础设施的影响 包含每一个用户到他们的推荐的映射的推荐模型是一个相当庞大的文件。由于职位对于每个国家来说都是本地的,我们首先尝试将我们的数据基于大约的地理边界进行分片。我们在每一块区域运行模型构造器,而不是在整个世界运行一个。每一个地区都有多个国家组成。举个例子,东亚地区包括为中国、日本、韩国、香港、台湾以及印度的推荐。 但是在分片之后,一些区域产生的数据仍然十分庞大,需要花好几个小时才能通过广域网从欧洲数据中心拷贝到奥斯丁的Hadoop集群。为了解决这个问题,我们决定增量的传输推荐数据,而不是一天一次。我们重用了连续先写日志(sequential write ahead logs)的方法,通过日志结构合并树来实现。这一方法已经在Indeed的其他大型产品应用中得到验证,比如我们的文档服务。 我们修改了我们的模型构建器,将推荐数据存储成小的分段,而不是产生一个单独庞大的模型文件。每一个段文件使用顺序输入输出,并且为快速复制做了优化。这些分段在远程数据中心运行推荐服务时将被重新组装成一个日志结构合并树。 这一基础架构的改变使得用户可以比之前快数个小时在远程的数据中心上看到他们新的推荐。从我们的A/B测试的结果来看,由用户更快的得到新职位推荐带来了30%的点击量提升。 这一改进展示了工程基础设施的改进与算法的改进带来的影响不相上下。 改进A/B测试的速度 建立起计算和更新推荐的管道只是一个开始。为了改进覆盖率和推荐质量,我们需要加快我们的A/B测试的速度。我们为了调整最后的推荐集合做了很多决策。这些决策包括,相似度阈值,每一个用户的推荐包含的职位数量,以及各种不同的用来过滤掉低质量推荐的方法。我们想要调节和优化计算推荐的各个方面,但是这需要逐个对算法的每个改进都构建新的模型。测试多个改进想法意味着处理用户请求的服务器上多倍的磁盘以内存占用。 我们开始通过传输计算推荐的单独组件而不是最终的结果来改进我们的A/B测试。我们改变了推荐服务来执行最后的计算,即通过将碎片整合起来,而不是简单的读取模型返回结果。重要的推荐子组件是每个用户的集群分配,从每一个集群到这个集群中的职位的映射以及一个对于每个用户来说包含不应该推荐给他们的职位的黑名单。我们修改了我们的构建器,来产生这些组件,并且修改了我们的服务,将他们在收到请求时组合起来从而返回最终的推荐列表。 通过实现这种架构上的改变,我们只传输那些在每一个A/B测试中改变的子组件。比如说,如果测试只调节了什么样的职位会从一个用户的推荐中除去,那么我们只需要传输这个测试组的黑名单。 这一改变改进了A/B测试的速度的数量级。我们能够在很短的时间内测试并验证多个可以改进推荐质量和覆盖率的想法。之前,由于设置环境的开销较大,我们平均每个季度只能测试一个模型中的改进, 我们的经验表明A/B测试的速度应该在设计大型机器学习系统时就被考虑进去。你能越快地将你的想法放在用户面前,那么你就能越快地在上面迭代。 这篇文章总结了我们在构建我们的推荐引擎时做出的一系列算法和架构上的改变。我们迭代地构建软件,我们从一个最简单原型开始,从中获取经验,并不断改进。这些改变带来的成果是职位推荐的点击增加从2014年初最简原型时的3%增长到了14%。 我们将继续精炼我们的推荐引擎。我们正在使用Apache Spark建立一个原型模型,建立一个模型集成组合,并精炼我们的优化参数来应对流行偏见问题。   Preetha Appan Preetha Appan是Indeed的高级软件工程师,是高性能推荐搜索分布式系统的专家。她对Indeed的职位和简历搜索引擎的贡献包括,文本切分改进、查询扩展特性以及其他重要的基础设施和性能改进。她乐于并享受解决机器学习和信息检索方面的挑战性的问题。 来源:OReillyData
    Indeed
    2016年12月26日
  • Indeed
    招聘搜索引擎Indeed2015年上半年营收同比上涨57%达3.003亿美元 全球最大的职位搜索引擎Indeed日前宣布,该公司2015年上半年实现3.003亿美元的营收,同比上涨幅度达到57%。Indeed能够实现对1,600万工作搜索,对求职者而言,是名符其实的全球第一大求职网站。 Indeed总裁Chris Hyams表示,“每个月全球有超过1.8亿人会通过Indeed来找工作,Indeed也持续聚焦于帮助人们找到工作,而不断地加大投入,以期能够成为支持通过各种设备来进行求职的求职网站,进而帮助求职者能够在数以万计的工作机会中找对最合适自己的。 此外,SilkRoad 4月发布的一项调研显示,Indeed是最主要的外部招聘渠道。求职者能够免费通过Indeed获得全球超过50个国家的招聘网站与企业网站上发布的岗位信息。伴随着越来越多的求职者偏向于用移动设备来求职,Indeed有很大一部分访问量就是来自于移动设备,也因此,Indeed也在包括美国在内的二十多个国家开发出了一款移动APP,2015年上半年Indeed移动应用已经有1,300万次的下载量。 Indeed Half Year 2015 Revenue: $300.3 Million, 57% Year-over-Year Increase (Nov. 24, 2015,/Business Wire/) Indeed, the world’s leading job search engine, generated $300.3 million of revenue in the first-half of 2015, 57% higher than the previous year. By making it easy to search more than 16 million jobs, Indeed has become the #1 site for job seekers globally as well as in the US, UK, Germany, France, the Netherlands, Italy, Brazil, Japan, and many other countries around the world. “Every month, more than 180 million people around the world come to Indeed to find the right job for them,” said Chris Hyams, President of Indeed. “By focusing on helping people get jobs, Indeed continues to invest in getting all the world’s jobs online, making it easy to apply for positions from any device, and helping job seekers find the best fit opportunity for them out of millions of options.” While Indeed started by indexing the world’s jobs -- many of which are hosted on company career sites and job boards -- today Indeed offers a solution that allows companies from around the world to post their jobs directly on its site for free. Today, millions of these jobs are not available anywhere else -- they are posted exclusively to Indeed. For the fourth year in a row, research from SilkRoad published in April showed that Indeed is the leading source of external hires. Indeed gives candidates free access to millions of jobs from thousands of company websites and job boards in over 50 countries. As job seekers increasingly prefer to bring their job search with them on a personal phone or tablet, the majority of Indeed’s traffic now comes via mobile devices. As a result, Indeed is now the number one mobile job app for iOS & Android in the US and more than 20 other countries. During the first-half of 2015, the Indeed app was downloaded more than 13 million times.  来源(URL):Business Wire
    Indeed
    2015年11月26日
  • 123