请介绍一个你主导的、数据量最大的数据清洗项目遇到了什么困难你在团队项目中与开发或产品意见不一致时通常怎么处理描述一次你通过数据分析发现并解决业务问题的完整过程。如果业务方临时提出一个紧急的数据需求但会打乱原有排期你会怎么办请举例说明你是如何优化一个执行效率低下的Hive或Spark任务的。你如何确保数据仓库中数据的一致性在数据建模时你是如何与业务方沟通以确定需求的请分享一次你处理数据倾斜问题的经验。当你发现上游数据源的数据质量突然下降你的处理流程是什么描述一次你使用Flink或Kafka处理实时数据流的项目经历。你如何评估和选择一个新的数据处理工具或框架请举例说明你如何设计一个高效且易于维护的ETL流程。当你的数据任务在凌晨定时失败且影响早间报表你会如何应急你如何向非技术背景的业务同事解释一个复杂的数据模型在数据项目上线后你是如何进行监控和保障数据稳定的请分享一次你通过数据治理如元数据管理、数据血缘解决问题的经历。你遇到过最棘手的数据质量问题是什么最后如何解决的描述一次你为了提升查询性能而对数据表进行的优化。当多个业务方对同一个指标的定义有分歧时你如何协调请举例说明你如何平衡数据开发的“快”快速响应和“稳”稳定可靠。你如何管理自己负责的多个数据任务的优先级在数据仓库的维度建模中你遇到过哪些挑战是如何应对的请分享一次你从0到1搭建一个数据主题域或数据中台某模块的经历。当业务需求频繁变更导致数据开发反复返工时你会怎么应对在腾讯海量数据场景下你如何设计一个支持高并发、低延迟查询的数据服务描述你在处理用户行为日志这类非结构化或半结构化数据时的典型流程和方法。如果让你负责腾讯某产品如微信支付、游戏的核心数据链路保障你会重点关注哪些环节请结合具体案例说明你如何利用数据技术提升业务增长或用户体验。在数据安全与隐私保护越来越重要的背景下你在数据工程实践中会采取哪些措施面对业务数据量快速增长你有哪些数据架构层面的规划或演进思路如何设计一个可追溯、易复盘的数据质量监控体系在实时数仓和离线数仓并存的场景下你如何保证两者数据结果的一致性请分享你对数据湖、数据湖仓一体等新架构在腾讯业务中落地应用的思考。当需要将一个运行多年的老旧数据系统迁移到新平台时你会如何规划和实施在A/B测试实验平台的数据支撑方面你认为数据工程师需要关注哪些核心问题如何设计一个灵活、可扩展的埋点数据采集与接入方案描述一个你处理过的、对数据准确性要求极高如金融风控、计费的场景。在团队技术选型中你如何推动一项新的数据技术如ClickHouse、Doris的落地当数据产出延迟且影响多个下游关键业务时你的排查思路和止损方案是什么请举例说明你如何通过数据治理来降低数据存储和计算成本。往期精彩面试问请讲一下你在数仓各层是如何设计多时区处理逻辑的字节大数据开发面经中国交易与广告| 校招为什么本体论在企业落地步履维艰一种铁路道岔转辙机监控数据的数仓降采样方案数仓治理基于update_time增量同步方案的生产落地规范面试问DS中数仓分层调度策略是怎样的是所有的任务都写到一个WF中吗SQL如何寻找差集Not Exists 与Left join is null 如何选美团SQL面试题:用户最近消费天数两次消费间隔计算SQL面试提问NTILE等频分桶和自定义区间分桶到底有什么区别同环比分析为什么生产环境中必须用LEFT JOIN而不用LAG| 附实战案例数仓ETL全链路增量计算实战数仓建模中业务过程与业务状态有什么区别、如何识别| 易混淆概念