8月4日下午,在2022新京报贝壳财经夏季峰会“下一代互联网离我们有多远” 数字技术主题论坛的圆桌论坛环节,微博COO、新浪移动CEO王巍介绍了微博如何合理利用算力应对流量高峰。他认为,对于微博来说,东数西算的最大挑战在于西部数据中心到东部输送算力过程中汇总的网络延时问题,“在持续推动算力基础建设方面,有一点非常重要就是统筹布局绿色、智能的算力基础设施,推进一体化的数据中心的体系建设。”

东数西算数据需要双方交互主要挑战在网络延时问题


【资料图】

对于配置算力时所产生的成本,王巍表示,微博的很大一部分工作是与网络相关的降本增效,“东数西算和南水北调、西电东送不太一样,东数西算的数据流需要双方交互,所以我们在利用西算的云计算服务设施的过程当中非常关注网络环境、网络条件。我觉得东数西算对互联网公司主要的挑战,就在于西部数据中心到东部输送算力过程中网络延时的问题。”

据了解,对于东数西算,微博在技术方面也在做测试。王巍透露,更快的节奏是建设一些环京的数据中心,例如在内蒙古、河北等离北京比较近的地方,这可以有效地减少网络时延。同时,微博也积极建设一些离线的分析专用的数据中心,积极验证时延不敏感的业务,做分离部署,从自身做好技术储备,应对东数西算带来的机遇和挑战。

王巍认为,在持续推动算力基础建设方面,有一点非常重要:就是统筹布局绿色、智能的算力基础设施,推进一体化的数据中心的体系建设。进入到ESG时代,企业对环保、对社会责任的担当相当重要,怎么样能够部署绿色的、智能的算力平台以及云计算的平台非常重要。

“在这个过程当中,我们要加速打造数据跟网络的协同,数据跟云服务的协同,云计算和边缘计算的协同,在东数西算的网络传输当中,边缘计算云是一个很重要的应用方向,我们觉得在这几个方面的协同上,绿色智能的多层次算力的设施体系能够部署起来、能够得到发展,实现算力水平持续显著提升,这样才能夯实数字经济发展的算力。”他表示。

AI技术赋能媒体运营全流程

王巍表示,微博的智能信息平台能够利用AI技术对新浪新闻的媒体运营工作进行赋能。“媒体很多日常工作,我们简单归纳为采集、编辑、审核、播放,其中播放在自媒体时代也称为分发。我们在采、编、审、播全流程都应用了相关的AI技术。”

“具体来看,我们实时抓取全网信息,借助账号社交关系、事件识别、统计分析等技术,进行内容结构化挖掘,提取如传播节点(账号)、事件主题(内容特征)、明星大V行为(行为特征)等数据特征。基于这些数据特征,编辑再结合经验进行人工的线索策略配置,借助AI大数据实时计算能力,对海量信息进行用户数据和内容数据的深入洞察分析,预测并输出线索。然后,通过最终的人工审核和决策,把用AI技术发现的线索推送给用户”。

王巍称,除了线索发现以外,新浪新闻在内容生产的过程中也使用了很多的AI技术,在包括模式识别、计算机视觉、CA、图像处理、图形学、语言处理、MOP等方面进行了很多深入的研究。

“基于基础算法,我们重点在文本和视觉能力上进行了相关算法模型落地。实现了标题摘要自动化、文章自动配图、文章主题识别和内容自动纠错等文本处理模型;也实现了事件脉络自动梳理、舆情观点分析、文章质量评分、语义排重等文本理解模型;还实现了图像裁剪、视频质量评分、视频排重和标签化等视觉模型。这些技术赋能到我们的文章编辑发布、中间页制作、专题自动生成等业务流程中。显著提高了我们内容生产能力和效率。”王巍说。

(文章来源:新京报)

推荐内容