2026/1/9 21:27:59
网站建设
项目流程
惠州网站搭建,编程培训机构推荐,做旅游那些网站好,wordpress正文页面青云智算该企业由青云智算投递并参与金猿组委会数据猿上海大数据联盟共同推出的《2025中国大数据产业年度AI Infra领先企业》榜单/奖项评选。大数据产业创新服务媒体——聚焦数据 改变商业TCL集团拥抱AI、建造新型AI Infra#xff0c;来自全球AI技术产业化加速、国家政策导向…青云智算该企业由青云智算投递并参与金猿组委会×数据猿×上海大数据联盟共同推出的《2025中国大数据产业年度AI Infra领先企业》榜单/奖项评选。大数据产业创新服务媒体——聚焦数据 · 改变商业TCL集团拥抱AI、建造新型AI Infra来自全球AI技术产业化加速、国家政策导向、自身全产业链升级需求及行业竞争驱动叠加其长期技术与场景沉淀以“AI向实”为核心推动AI落地创造真实价值。全球AI技术与产业浪潮倒逼基础设施升级。AI竞争聚焦模型参数与算力基建扩张但出现技术空转、算力浪费、同质化内卷等问题AI多停留在技术层未充分落地。同时传统软硬件架构难以支撑未来发展需求。中国制造业正从加工制造向高端制造、智能制造转型政策鼓励企业以AI赋能全链条TCL依托半导体显示、新能源光伏、智能终端全产业链借助AI Infra推动制造升级契合国家战略导向。TCL业务覆盖研发、制造、供应链、运营、终端等多个环节全链路数字化与智能化在AI时代提出新需求以数据智能驱动决策优化、供应链协同和管理精细化。TCL在语音识别、图像识别等AI领域早有布局拥有海量真实生产与消费场景数据能为为垂域AI模型训练、AI Infra优化提供核心资源。与此同时消费者对个性化、智能化产品需求不断提升TCL需通过AI Infra提供新的IT支撑打造差异化优势实现品质升级与成本优化巩固全球化竞争地位。时间周期项目开始时间2025年6月中旬中间重要时间节点2025年6月底完成惠州公司AI Infra一期部署2025年8月完成深圳公司算力统一纳管。项目完结时间2025年8月AI Infra应用需求结合业务推进中的实际痛点与长期发展规划TCL明确提出对AI Infra的四大核心需求以改变当前基础设施支撑能力不足的问题一是构建跨部门协同的算力调度体系解决多业务线、多算法团队同时争抢GPU资源的协调难题保障研发与生产任务的高效推进二是实现算力资源的精细化运营打破传统物理机独占模式提升资源利用率降低闲置资源浪费三是搭建灵活适配的多场景计算支撑体系由于AI应用场景不同存在差异化计算需求而传统物理机配置流程复杂难以实现简化机器配置流程难以快速响应与适配四是建立标准化的跨地域运维体系降低多区域运营维护成本提升基础设施的整体稳定性与可扩展性。在青云智算看来TCL的AI Infra需求本质上是构建“算力集约化、运营精细化、适配灵活化、运维标准化”的智能基础设施底座核心目标是打通算力资源与业务场景的协同壁垒为AI技术在全产业链的落地提供稳定、高效、低成本的基础支撑。在资源层核心是解决“算力供需失衡”与“资源浪费”的矛盾需实现从“物理机独占”到“虚拟化/容器化共享”的转型通过资源池化改造提升GPU等核心算力资源的调度效率与利用率。在运营层重点解决“配置繁琐”与“调度低效”的问题全流程化管理需覆盖资源申请、分配、配置、回收全生命周期实现多部门需求的智能调度与优先级排序。面临挑战作为中国最大的、全球性规模经营的消费类电子企业集团之一TCL集团及各分子公司在人工智能、大数据分析、高性能计算等领域的业务需求日益增长业务对GPU算力资源的需求呈现出爆发式增长也面临一些现实问题。组织架构分散导致AI Infra需求碎片化。TCL集团下设多个分子公司及业务板块各板块拥有独立的IT运维团队与资源调配权限且不同业务线对AI Infra的认知与需求存在差异给整体AI Infra底座的统筹规划带来阻碍。同样GPU算力资源分散于各业务部门采用物理机静态分配模式缺乏统一的算力调度中枢当大规模算力需求出现时资源无法快速聚合调度。更重要的是各业务部门在地域上也是分散的缺乏统一的监控、告警与故障响应机制难以实现全域基础设施的集中管控。到业务创新层面AI训练环境异构化严重部署效率低且兼容性差如果搭建独立训练环境环境配置需手动调试单场景部署耗时超4小时且不同环境间存在兼容性壁垒难以支撑跨团队协作。业务连续性的保障也是AI Infra建设中必须考虑的问题。AI Infra作为支撑集团全业务线AI应用的核心底座其建设与升级涉及现有IT架构改造、资源迁移、系统适配等多个关键环节而这些环节均可能对当前正常的生产研发业务产生冲击。如何在AI Infra架构升级、技术改造与资源迁移过程中建立科学的风险防控机制与平滑过渡方案确保现有核心业务不受影响、数据安全得到充分保障成为集团推进AI Infra建设必须突破的关键难点之一。战略目标构建AI Infra的顶层战略目标核心是以统一AI Infra为核心底座全面支撑 “AI向实”战略落地驱动全产业链智能化变革强化全球产业竞争壁垒。其一构建集团级统一AI Infra底座实现资源统筹与效率升级。GPU服务器的资源池化整合建立统一算力调度中枢将GPU资源利用率从当前不足35%提升至65%以上跨部门资源协同响应时长从超3个工作日缩短至10分钟内。其二推动AI价值规模化落地实现业务提质增效。通过AI Infra支撑全产业链AI应用规模化部署推动5年内覆盖80%以上的核心生产与研发场景。其三推进运营运维标准化升级降低管理成本与风险。依托AI Infra搭建集团统一的自动化运维和运营管理平台实现算力资源全生命周期申请、分配、监控、回收、计量计费、账单统计自动化管理自动化运维覆盖率提升至90%以上建立标准化运维流程与故障分级响应机制每年运维管理成本降低25%以上。实施与部署过程针对TCL的AI Infra核心需求青云智算依托十余年企业级服务沉淀的全栈技术能力与产品体系联合TCL成立专项实施团队从资源投入、系统架构、核心技术、重要产品、创新思维、团队配合六大维度构建协同实施体系确保项目高效落地并达成预期目标推进智能基础设施的重构与升级。1.精准化资源投入构建供需匹配的算力与人力支撑体系在资源投入层面双方秉持“按需配置、弹性扩展”的原则形成算力资源与人力资源的双重协同支撑。在算力资源投入上青云智算协助TCL完成全集团算力资源的盘点与整合针对不同业务线的算力需求差异制定分层级的资源投入方案对于核心研发场景如大模型训练、算法迭代优先投入高性能NVIDIA GPU通过资源池化改造整合现有GPU服务器同时预留弹性扩容接口支持业务高峰期算力的快速调度对于常规计算场景如OCR图像识别、大模型推理采用虚拟化切分技术实现资源的精细化分配避免物理资源的浪费。为保障项目推进效率对TCL存量服务器、存储设备进行兼容性测试与优化确保青云产品体系与现有硬件资源的无缝对接。在人力资源投入上双方组建跨职能专项团队。其中青云智算核心成员均具备丰富的AI Infra项目落地经验TCL则投入IT部门及运维团队的核心人员负责需求对接、业务场景梳理及内部协调工作。为确保资源投入的精准性双方建立资源动态调整机制通过定期的项目进度复盘根据业务需求变化与项目实施难点实时优化算力资源分配与人力配置保障资源投入与项目进度的高效匹配。2.全栈式系统架构搭建“兼容历史、面向未来”的AI Infra底座基于青云AI Infra 3.0全栈架构理念双方共同设计了“四层架构、统一调度”的系统架构方案实现通算与智算的协同调度兼顾TCL存量系统兼容与未来业务扩展需求。架构底层为PrimusOS信创操作系统层确保对异构硬件环境的全面兼容为上层架构提供稳定的运行基础。架构核心层为KubeSphere统一调度底座这是整个AI Infra系统的“中枢神经”。该层基于青云成熟的云原生架构实现对全集团算力资源的统一纳管与调度打破传统部门割裂的资源管理模式。通过这一层架构可实现CPU、GPU等异构资源的池化管理支持一张物理GPU卡的精细化切分与动态调整既满足多业务线的差异化算力需求又提升资源利用率。同时实现存量应用与AI应用的协同运行避免了颠覆性改造带来的业务中断风险。架构顶层为开放服务层通过开放API及MCP协议支持TCL根据业务需求对接第三方应用服务实现AI算法开发、模型微调及应用发布的全流程支撑为业务创新提供灵活的扩展能力。3.核心技术突破破解资源调度与运维协同关键难题围绕TCL的核心需求双方聚焦四大核心技术突破确保AI Infra系统的高效运行。在异构算力调度技术上采用青云智算自研的智能调度算法实现对NVIDIA GPU、国产GPU等多元异构算力的全面纳管与智能分配。该算法具备需求优先级识别能力可根据TCL业务重要性自动排序算力需求确保核心业务的算力优先保障同时支持算力资源的弹性伸缩根据任务负载动态调整资源配置实现算力需求与资源供给的实时匹配大幅提升GPU资源利用率。在容器化与虚拟化技术应用上采用Kubernetes容器化技术与vGPU虚拟化技术相结合的方案。通过容器化技术实现AI训练环境的标准化封装形成多套场景化环境模板解决传统环境配置繁琐、耗时冗长的问题借助vGPU技术实现物理GPU资源的精细化切分支持多用户共享同一物理GPU同时保障不同用户数据与任务的隔离安全有效降低资源浪费。针对跨地域运维难题双方采用分布式监控与智能告警技术构建全地域统一的运维监控体系实现节点、任务、容器组及GPU资源的全方位监控支持自定义告警规则与多渠道通知确保运维问题的快速发现与响应。在数据协同技术上通过统一的数据接入接口与标准化的数据处理流程采用数据加密与权限管控技术确保跨地域数据传输与存储的安全合规满足数据安全法规要求。这些举措在技术层面有效破解了TCL在AI Infra建设中面临的资源调度、环境适配、跨地域运维及数据协同四大关键难题。4.产品化落地支撑依托青云成熟产品体系实现需求精准匹配项目实施过程中重点依托青云智算核心产品——青云AI智算平台。该平台具备千卡级资源管理能力支持多框架模型的一键部署与快速迭代可轻松应对大规模AI训练任务及微调与推理任务。平台内置多种标准化AI工具与环境模板用户可根据业务需求快速搭建训练环境将单场景环境部署耗时从4小时以上压缩至30分钟内大幅提升研发效率。平台支持多租户隔离机制能为TCL各业务部门分配独立的资源空间保障数据安全与业务隔离支持资源使用的计量计价功能便于各部门资源使用的成本核算与优化助力实现算力资源的精细化运营。平台的统一运营运维能力能帮助TCL跨地域运实现基础设施的集中管控。同时平台具备自动化故障诊断与修复能力自带1000故障特征库。结合支持运维流程的标准化配置等功能降低跨地域运维成本。5.创新性思维引领价值带动以破解转型难题项目实施过程中双方以创新思维为引领确保项目高效推进并实现价值最大化。一是分阶段实施策略。项目整体分为三个阶段第一阶段完成核心算力资源的池化整合与统一调度平台部署解决跨部门算力争抢问题实现全集团AI Infra的一体化管控。第二阶段部署多可用区。这种分阶段实施模式既保障了现有业务的连续性又逐步实现了AI Infra的全面升级。二是建立AI Infra价值评估体系通过资源利用率、运维效率、业务创新速度等多维度指标量化项目实施价值持续优化资源配置与系统架构确保项目实施始终围绕价值落地展开。6.深度化团队配合构建“协同高效、权责清晰”的合作机制为确保项目顺利推进双方建立了多层次、全流程的团队配合机制。在决策层面双方骨干组成的项目指导委员会负责项目整体方向的把控、重大资源的协调及关键问题的决策。在执行层面组建联合项目组及时同步项目进度、解决实施难点。在沟通机制上建立多渠道协同沟通体系包括即时通讯工具及定期的跨部门协调会。在风险管控上双方共同制定风险识别与应对预案建立风险预警机制通过定期的风险评估会提前识别项目实施过程中的技术风险、协调风险与业务中断风险并制定针对性的应对措施。同时建立知识共享机制青云智算为TCL团队提供系统的产品使用与技术运维培训TCL团队则向青云智算传递业务场景知识实现技术与业务的深度融合为项目长期稳定运行提供保障。通过六大维度的协同实施青云智算与TCL成功构建了“算力集约化、运营精细化、适配灵活化、运维标准化”的AI Infra基础设施底座。合作服务效果本项目通过AI Infra的重构升级为TCL带来全维度价值跃升核心体现在三方面其一AI Infra能力实现质的飞跃从分散割裂升级为统一高效的智能底座GPU资源利用率提升至65%以上跨部门协同响应与环境部署效率大幅提升跨地域运维稳定性与合规性达行业高标准彻底破解算力调度、运维协同等核心痛点。其二商业价值精准落地通过资源精细化运营与运维优化每年减少成本数百万元投资回报周期1.5年以内同时推动研发与运营效率提升核心算法迭代周期缩短50%为业务增效创造显著增量价值。其三夯实长期战略基础构建全产业链AI落地支撑体系强化全球化协同竞争能力推动TCL向“AI Native”转型形成“技术-业务-价值”正向循环为长期商业增长注入核心动力。关于企业·青云智算北京青云智算科技有限公司简称青云智算是北京青云科技集团股份有限公司简称青云科技的子公司。顺应算力基建、人工智能等趋势与需求结合青云云计算十余年的技术积累和运营经验青云智算打造了统一调度、统一管理、统一运营多元异构算力的AI智算平台 实现多元异构算力的统一调度与管理提高 AI 算力的整体使用效率和管理效率在多个行业成功部署了AI 解决方案涵盖智算中心、金融、具身智能、高校科研、大模型/多模态、自动驾驶、医疗医药等领域。点击文末“阅读原文”链接还可查看青云科技官网·TCLTCL科技集团股份有限公司简称TCL创立于1981年是拥有半导体显示、新能源光伏等多个业务板块的科技产业集团。现有7.5万员工、29个研发中心、18个制造基地累计7.6万件专利申请。处于高科技制造行业TCL以“领先科技和合共生”为使命在与人类生活密切相关的科技领域持续投入建立技术与产品领先优势赢得客户的信赖。★以上由青云智算投递申报的企业最终将会角逐由金猿组委会×数据猿×上海大数据联盟联合推出的《2025中国大数据产业年度AI Infra领先企业》榜单/奖项。该榜单最终将于1月上旬上海举办的“2025第八届金猿大数据产业发展论坛——暨AI Infra Data Agent趋势论坛”现场首次揭晓榜单并举行颁奖仪式欢迎报名莅临现场。