张建林:走出“舒适区”,愿做智能运维的“布道者”

申耀的科技观察 2023-08-08 12:32:07

在出任科来研发中心副总经理一职之前,张建林在行业内已有着非常资深的“履历”,他曾任招商银行数据中心系统运行、应用管理负责人,招行资深工程师,对应用全生命周期的智能化运维具有非常丰富的理论研究与实战经验,还曾荣获人民银行科技发展二等奖及全国数据中心联盟科技一等奖、银监课题二等奖等“奖项”。

那么,是什么原因让张建林勇于走出“舒适区”,接受新的工作挑战呢?对此,张建林并没有直接回答笔者这个问题,而是讲了这么一个故事——此前,一位创业公司CEO和他沟通时,有一句话让他留下了深刻的印象,那就是这位CEO认为他在招行多年沉淀的运维经验,如果愿意分享给更多的同行,那么就会让整个行业“减少”摸索的时间成本,并且未来通过持续的技术创新,也能够让整个运维行业实现“弯道超车”的机会。

这句话打动了张建林,他告诉我:“一直以来,我对新知识新事物都是保持着好奇心的,也是愿意接受这种挑战的,更关键的是在招行多年的从业经历,也能看到国内金融行业在运维领域的技术领先性,其实现在也走到了全球比较领先和顶尖的位置,因此如果有一个更大的平台,能够把我多年的经验释放出来,贡献给整个行业,我觉得也是非常开心的一件事情,这也促使我产生了走出‘舒适区’的初衷和想法。”

最终,张建林“加盟”了技术领先的网络流量分析企业——科来网络技术股份有限公司,负责科来云产品及业务线,并带领团队通过技术创新实现了云上云下一体化智能运维,更好地满足了用户业务全链路监控,实现全网可观测性,以及故障精准发现与快速定位溯源的需求,最大化地保障企业核心关键业务高效、安全运行。而在未来的工作中,张建林也希望以智能运维领域“布道者”的角色,充分发挥和释放出科来和个人的价值,为更多企业革新转型与智能运维的发展贡献出更多的力量。

网络运维迎来新挑战

科来致力于成为全球领先的数字化互联智能时代的守护者,围绕数字化互联智能系统保障的相关技术产品的开发,希望更好地保障客户数字业务更安全、更可靠、更高效。

科来拥有着国内最早开始研究网络流量分析技术的团队,当时国外软件功能强大但操作复杂、且不符合国人习惯,因而科来决意独立研发面向国人的网络流量分析产品。20年来着眼千行百业客户数字业务变迁与转型,科来发展与技术世界变革同频共振,逐渐形成了基于全协议分析与回溯技术为核心的多维度产品体系,在不断深入协议分析技术与产品打磨的同时,又向上延伸出安全、运维、云等不同的产研方向。

众所周知,在2023年初发布的《数字中国建设整体布局规划》中,明确要求构筑自立自强的数字技术创新体系,筑牢可信可控的数字安全屏障,通过数字化方式提升效率,持续推进科技赋能与科技转型。此外,2023年5月1日《关键信息基础设施安全保护要求》正式实施,也要求面对以网络攻击、丧失功能、数据泄漏等为目的的关基风险,关基保护单位要做到关键业务连续运行及其重要数据不受破坏。

而网络流量分析技术作为至关重要的基础技术,在关键业务的保障中就起到了非常重要的作用。例如,在运维工作中可以保障业务的高效、稳定运行,提升整体运维的成熟度;此外,利用流量分析技术,通过全方向全流量的回溯分析,也能帮助企业做到安全监测“无死角”,让企业具备对安全风险的发现能力、分析能力、识别能力和处理能力,帮助用户整体提升网络安全防护级别的同时,也能提供业务规划的决策支撑依据等。

在张建林看来,随着过去几年新技术的快速发展,基于网络流量分析技术开展的运维工作也出现了新的演变趋势:

一方面是,传统网络向云网络的演变,主要体现在虚拟化技术的出现,颠覆了原有的数据中心的网络模型,使得传统网络技术已不足以适配云原生环境下产生的新场景,如在云原生环境下,用户可以将各类工作负载创建和部署在更小单元,流量在这些细小单位之间流转,网络情况无法“一目了然”,而云上云下的流量也难以串联、统一。

而洞悉查明网络真相一直是企业网络运维与安全的首要工作,运维人员对网络的了解程度直接影响网络规划、运维排障、责任界定等重要方向。也正因此,这种变化对最底层的“网络流量分析”技术也产生了很大的影响。

另一方面,是网管系统向网络可观察的演变,背后也意味着在新时代网络运维管理需要“与时俱进”的迭代和升级,包括了三个层面,即基础设施的“采控层”;第二层是网络流量监测的“精细化”分析层;第三层就是智能化和可观测性发展。

“从客户的具体的工作中,也能非常明显地看到这种变化,很多客户在业务上云的过程中,对于网络的可控程度已经是跟传统网络时代不在一个层级上面了,越是深度用云,很多行业客户对于网络精细化管理诉求就越高。”张建林说。

由此可见,随着企业应用部署的范围从传统数据中心扩展至公有云、私有云和混合云模式,应用服务的复杂性和多样性都在快速上升,而这对网络运维的工作也提出了更高的要求,同样这也让底层的网络流量分析技术的创新与变革也变得势在必行。

构筑一体化智能运维

也正是基于这样的洞察,科来打造了“科来云魔方智能云网分析平台”,该平台通过云网全流量采集分析建立云网监控评估体系,集合“全量、全链、全栈、智能、回溯、灵活”六大关键能力于一体,从云网络数据可读、云网络地图可视、云网络流量可视、云网络运维可控等几大方面为云网络运维部门提供云网络可视化及流量监控。同时,该平台以分布式集群方式部署在云内,实时收集部署在云网中的探针采集流量数据,经过二次分析处理,以业务视角呈现云网、业务健康质量及安全风险。

张建林表示,相比市场上其他产品,“科来云魔方智能云网分析平台”有着几个非常独特的优势,首先是在云上云下的全流量采集能力方面,科来自研了“软探针”技术,所谓“软探针”指的是虚拟交换机的流量镜像,或者说是对CBPF以及EBPF能力的应用或者优化。

企业上云后,不再大规模使用物理机部署业务,大多利用虚拟化技术对计算资源进行统一的池化管理,这时同一物理机不同虚拟机之间的业务交互的东西流量不再经过网络物理交换机,因此这也让传统数据中心中的流量采集方案变得毫无“用武之力”,因此云环境下的流量采集重点要关注虚拟机之间东西向流量的采集以及性能问题。

而科来自研的“软探针”技术,在网络流量的采集和分发方面,性能容量不仅是最优的,且在整个资源的消耗中也是最小的。“软探针中的引流跟镜像目前市场上也有很多的开源技术,不少产品和方案也都是基于开源的能力去封装的,但科来通过对比之后发现,自研的方案相比开源的方案,无论是性能和可靠性上都更加有优势,毕竟科来对流量技术的钻研已经有二十年的历史,无论是技术研发能力,还是硬件适配的经验方面都有着很多的积累,这也是我们选择自研软探针技术的关键原因。”张建林说。

其次,云上数据全场景精准呈现方面,科来打造的这套平台也做到了系统“开箱即用”,用户可以进行快速独立部署,操作界面简洁清晰,功能易用,所需数据精准呈现,能够全方位满足更多行业、更多场景的需要。

张建林表示:“科来在网络数据的处理能力方面,不仅继承了我们在传统网络时代沉淀下来的数据处理经验和能力,同时在软硬件的优化和结合方面也是较为领先的,由于科来的业界具备领先的技术能力,因此很多硬件厂商的产品往往都会送往科来做压测或者调优,这也让我们能够更好的实现软硬能力的结合,由此在数据采集方面也构筑了科来的独特优势。”

最后,就是场景化的应用方面,科来也有着大量的成功落地案例,而这些基于场景化打造的方案能力,也能为其他行业客户提供借鉴和参考的价值。“科来不仅在技术创新方面一直保持着领先优势,同时也有大量的一线客户帮助科来去打磨具体的应用场景,因此可以说无论是底层技术还是场景优化方面我们都是最优的。”张建林强调。

毫无疑问,通过科来云魔方智能云网分析平台,构筑的一体化智能运维能力,不但大幅的提升云上运维效率,同时更在复杂的云网业务关系中帮助运维人员理清“乱麻”,实现有序、高效、智能的业务保障,真正帮助了企业在全新的环境下实现了智能运维的建设。

携手华为引领升级“范式”

在此过程中,科来也积极与华为云携手合作,通过为更多的企业提供新架构和新平台的支撑,为企业的运维管理的转型和升级提供新的升级范式,进一步强化企业应对云上云下一体化运维的能力。

张建林表示:“科来和华为合作一直以来都非常地紧密,因为科来过去很多传统网络的客户,在上云过程中也选择了华为云,因此他们也希望企业的传统网络和华为云网络能够通过一个工具去实现数据打通、运维展示乃至业务监测,因此这也促使了双方产生了更加深度的合作需求。”

据介绍,双方在合作过程中优先解决的就是如何实现统一的网络流量数据的获取问题,其中有两种方案:一种方案是直接在华为云虚拟主机上安装科来的“软探针”, 优点是能够对华为云的“底座”是零干扰的,也是无感的,但由此带来的挑战是,业务的复杂度和权限要求会比较高;另外一种方案是,在华为云的云宿主机上安装科来“软探针”的插件,但里面也会存在一个很多的挑战,那就是华为云始终是在不断地迭代和升级的,而科来的“软探针”技术不能跟上每一次的版本迭代更新,或者说不能做及时的兼容性测试或者压测,也会给产生一定的风险,因此也不是最佳的解决方案。

目前,双方还在携手探讨创新的解决方案——即云测提供灵活的OVS引流的能力,再结合科来“软探针”以及后端流量分析的能力,这样就形成了云内流量的可视化方案,由此既化解了权限和部署的繁琐问题;又解决了对华为云底座的“侵入性”带来的众多风险问题。

目前,通过的双方的紧密合作和联合创新,目前科来和华为云不仅能够为行业用户设计和提供云上、云下一体化的解决方案;同时也能根据具体客户的具体应用和需求,推荐和匹配最适合的解决方案,最大化帮助行业客户解决云化时代的网络流量的问题,最大化的推动行业客户实现智能运维的升级和转型。

而展望未来,张建林也希望和华为云持续保持联合创新,包括从流量的采集、分发到后续的流量的分析和可观测方面,双方都能够用一个更加全方位的合作;此外,在云内安全方面,也是双方接下来会重点发力的方向。

不难看出,科来和华为云的深度合作,真正帮助企业消除了瓶颈、简化了操作、降低了风险,同时也为应用提供更快的价值实现时间,极大地提高企业的运维和运营效率,加快了企业的数字化转型,并引领了升级的“新范式”。

愿做智能运维的“布道者”

从招行到科来,从“甲方”到“乙方”,张建林坦言这个过程并没有角色转换的挑战。张建林说:“我的初衷和心态始终都是一样的,我在甲方的时候,也并不认为乙方是服务我的,因为我觉得是大家一起去共同学习的,乙方也能给到我很多的一些帮助。我的心态始终是希望大家能够在一致的目标下,形成共赢的一个局面。”

也正因此,很多科来的同事经常和张建林打趣说他是“最舒服的乙方”,一个例证是,现在张建林去拜访客户,或者说拜访甲方的时候,“并没有把自己完全当做一个乙方的身份和他们打交道。”

对张建林而言,他更愿意做一名智能运维领域的共创者,并在科来的平台上发挥出个人更多的价值,毕竟过去20余年的运营开发、海量运维和应用规划管理经验,是能够给整个智能运维行业的从业者更多的启发和价值的。

对此,张建林也告诉我:“现在整个行业最大的一个挑战是,之前懂云的人不懂网络,懂网络的人可能不太懂云,因此如何更好地实现云网融合,无论是企业还是从业者都需要从更高的维度来重新审视自我,并做好相关的工作。”

比如,针对企业智能运维的转型方面,张建林就给出了以下三点建议:一是在人的方面,企业需要快速地去组建一支云网络的技术团队;二是在工具方面,无论是自建也好,还是通过第三方购买也好,也要尽快找到适合企业发展需求的相关运维工具;三是流程方面,企业需要做好应用跟基础设施的整个全生命周期的管理和规划。

此外,在人才方面,针对目前云网人才缺乏的现状,张建林也希望更多的从业者能够在具体的工作中积极去拥抱新技术,拥抱开源,并通过具体的工作实践磨炼自身的能力和本领,这样才有机会更好地服务好企业,更好地提升企业的运维能力。

总的来说,随着数字化转型和全面云化的深入,基于网络流量分析技术加持的企业智能化的运维和管理变革已变得“迫在眉睫”,而现在有了科来和华为这样领先企业的强强联手,也有更多像张建林这样有着丰富从业经历人员的“躬身实践”和“积极布道”,相信一定能够打造出更多的新方案和新技术,最大化地满足新环境下企业的业务连续性和运维精细化的管理要求,助力企业更加“行稳致远”的高质量发展。

0 阅读:14

申耀的科技观察

简介:企业级市场观察和思考