搜狗搜索(搜狗搜索免费下载)
今年8月,搜狗搜索即将迎来它的12岁生日!从04年8月推出的第一版网页搜索,到如今微信搜索、知乎搜索、搜狗明医、英文搜索等不断地突破与创新;从50余人的研发组到如今近千人的搜索事业部……一路成长,不忘初心!搜索大不同,故事更精彩!搜狗搜索同学汇,一起来看搜狗搜索同学的成长故事。
本期人物:
简
介
李毅
搜索事业部 专家研究员
采访之先,早已听说过李毅老师,作为搜索事业部的专家级研究员,工作上的业绩大家有目共睹;早有耳闻我狗的技术人员都是一群低调实干型的人才,“高调做事、低调做人”用来形容再贴切不过。
其实在约采访的时候,心里有点犯怵,因为工作性质的缘故,他们的大部分时间都用在攻克技术难题,对于“抛头露面”的宣传工作并不擅长。抱着试一试的心态,拨通了李毅老师的电话,电话那头的他说因为开会的缘故,等会后再联系。本想着大概是没戏了,对于手底下带着一群技术精英,每天有许多待办事项要处理的他而言,采访估计是悬了。出乎意料的是他在会议结束后竟然回了电话,因而有了今天的这篇文章。
关于李毅老师,乃至更多的技术人员,对他们的最大感受就是“存粹”。存粹的工作,存粹的生活,踏实、诚恳、不浮夸。从毕业伊始到现在,这是他的第一份工作,而且一干就是8年。从最初的一个普通的研究员到如今手下带着20多人的团队leader,从最初的数据积累到如今的大搜索数据挖掘工作,一路走来,经历了搜狗从搜狐分拆独立运营到团队架构重组等方面的调整,但在他的描述下,没有想象中的跌宕起伏,反而是历经风雨后的云淡风轻。
别看巨蟹座的他平时比较低调,对自己的评价也是寡言不爱玩,更多的是坐在电脑前敲代码,工作中最开心的莫过于在攻克某一难题时,有了思路,并且将其实现的过程。当问他工作这么多年来有没有什么印象深刻的事情,在他的回忆中,提及更多的是和小伙伴们一起攻克难关的那些日子,然而关于自己搜狗搜索,他只提了一件:
还是2009年,那时他刚来搜狗不到一年,最初从事的是数据积累以及爬虫相关的工作,在此先科普一下“爬虫”相关的背景知识:
【随着网络的迅速发展,万维网成为大量信息的载体,如何有效地提取并利用这些信息成为一个巨大的挑战。搜索引擎作为一个辅助人们检索信息的工具成为用户访问万维网的入口和指南。爬虫是一个自动获取网络资源的程序,它为搜索引擎从万维网上下载数据,是搜索引擎的重要组成。面向网页搜索的爬虫系统从若干初始网页的URL开始,在下载网页的过程中,不断从当前页面上抽取新的、有价值的URL放入队列进行下载,并对曾经下载过的网页进行持续的更新。】
“当时,我们搜索引擎中收录的数据和竞品相比还有一定差距,为了丰富数据库,为用户提供更全面的检索服务,领导提出了“覆盖率指标”这样一项工作。刚接手项目时,据数据显示,和理想中的指标还有一定差距,经过一段时间的摸索,找到了技巧后再去做就顺手很多,覆盖率提升了,很少会出现在竞品中可以搜索到某项数据,但在我们的数据库中无结果的现象”李毅说。
他说,因为工作性质的缘故,平时团队内的工作主要集中在后台、线下,没有想象中的惊心动魄;即使接手新项目时,出于策略考虑,许多工作要求保密,别说公司之外的人,即使是同一个部门的同事,除了高层和项目组成员外,也要对内保密。
14年李毅所在的部门进行了调整,从之前的6人小组扩展到如今的20多人的大团队,随着组内成员的增加,身上肩负的责任也明显变重。尤其是在重组团队后,按照之前一人一岗的工作现状,当时有2位员工因为一些原因提出了离职,这给当时的团队带来了不少压力,作为团队leader的他,虽然平时很少说话,但也会留意大家的工作状态,力所能及的给予team member资源支持。
接手新团队以来,经历过没日没夜加班时的窘境,有过无数次老生常谈的对话,但让他最为难忘的却是那些和大家一起奋斗的日子。就拿去年上半年的“页面垃圾率”的指标来说,由于网络流量能带来巨大的商业价值,会有很多不法分子试图恶意干扰搜索排序算法,在搜索结果中会出现欺诈或者色情等不良链接,李毅小组所做的“页面垃圾率”的项目就是要将结果中的类似现象尽可能的规避。他回忆说,那段时间压力很大,一方面每周都会收到数据监测后的反馈,另一方面,之前已有的系统无法实现这一功能,这就要求项目组做一个全新的系统去发现,但是问题出现的速度之快,需要大家投入更多经历去攻克。
李毅说,那段时间里搜狗搜索,大家每周都会统计哪出现了问题,下周的同一时间会一起查看上周的问题是否得到解决,是否又出现了新的问题等等?工作节奏比较快,这对项目组的要求也比较高。经过了2、3个月的时间,页面垃圾率降到了和竞品相同的水平,并且做了更多的优化,因为这项工作的出色表现,李毅所在的团队还获得了事业部的优秀团队。
“为了高效、保质的完成这项工作,当时负责该项目的除了两名老员工和一名应届生外,还得到了一些同学的技术支持,更有专门的团队提供评测,这样我们才能针对出现的问题,更加系统、有针对性去解决。其实做数据评测的同学也很辛苦,他们要帮助我们做大量的数据,而所有的数据都需要人工标注,也是一项不小的工作量。”这就是李毅,不爱说话,看起来不善于表达情感的他,会将大家所有的努力都默默地记住。
从08年7月到16年7月,今年是李毅来搜狗的第8年,因为师兄的介绍加入了搜狗,在跳槽率极高的互联网行业中,能够一如既往保持初心,他说或许是得益于搜狗的企业文化--踏实、沉稳、不浮夸。在和他的聊天中可以感受到,虽然生活中的李毅低调朴实,但正是这个打代码到high的同学,带着小组一步一个脚印的为搜索业务添砖加瓦,他说搜索马上就12周岁了,而自己有幸陪伴搜索一起度过了它2/3的时光,说未来太长远,但在搜狗的每一天,都会尽全力带着自己的团队去好做每一件事,不止为搜索、不止为公司,更是为了所有用户。
文章评论(0)