给大家分享几个最新的社招大厂面试题,看看大厂的大数据开发社招面试变化整体来说还是属于AI数据开发大厂开始在大数据的基础上问一些AI数仓赋能的问题整体来看还是以大数据为主AI为辅。围绕着还是你们公司平台AI怎么做的,如何赋能数仓的你怎么借助这些平台赋能提效的其次你自己有哪些AI应用探索熟悉哪些AI应用中大厂数仓AI应用是一个工程化的过程需要借助公司平台建设的能力但是公司的能力往往也是能力的体现所以我们要熟悉大厂怎么做的现在涤生的同学冲击中大厂的基本简历都写了AI相关职责作为加分项1、字节抖音社招6年面试字节整体还是大数据为主AI为辅探索性问题自我介绍做的最好的项目哪个展开介绍下项目细节业务架构项目难点介绍数据治理怎么做的成果如何数仓规范设计如何监督规范的实施评价模型治理好坏的指标有哪些重复指标如何治理日常开发如何避免指标重复建设Spark任务除了长时效任务还有哪些异常治理过怎么发现的怎么定位的解决的Spark Shuffle 和MR Shuffle有什么区别宽窄依赖一段SQL到底启多少个job、stage?用过Starrock数据模型有几种每类有什么样的特性SR和CK关于Join性能的对比小文件是如何产生的并如何治理?你们数仓AI这块哪些探索你日常开发如何通过AI赋能提效Text-to-SQL主流的这种技术方向有哪几大类吗智能问数的准确性如何提升SQL连续登录变形题其他一些有的没的问题2、阿里云智-社招6年面试这个部门很看重AI的赋能应用问了比较多的AI问题1.Text-to-SQL应用经验2.Text-to-SQL是否做过评测级建设3.Spark任务优化中AI应用的流程4.大模型中是否出现幻觉以及是否有做分类和校准的工作5.AI在Spark任务优化中没有分析到位的部分如何解决6.AI在Spark任务优化过程中是否是自动化的是否考虑做成SOP7.数据资产管理可以从哪些方面入手使用AI大模型8.数据资产管理使用AI大模型可能出现哪些问题哪些部分更容易做以及如何去完善9.团队新人如何给代码规范10.数仓项目介绍与项目问题的问答11.数据湖相关问题3、平安集团社招5年面试整体还是大数据面试为主1、范式建模与维度建模的区别为什么用维度建模2、如何设计一张事实表列举关键字段并说明原因想听到 明细层的一张表主键、外键、事实3、数据清洗做了什么脏数据怎么做ODS和DWD的处理是什么4、比较复杂的半结构化数据如何处理例如日志如何落到结构化的表怎么做转化和逻辑化处理例如有一个长的码值的地址字段可能有缺失例如只有省或者定位到区文本字段如何解析这是一个关键字段不能舍弃如何处理5、如何针对一段运行缓慢的SQL进行调优6SQL连续三天用户登记7、HDFS\MR 的执行过程8、用户活跃度如何拆解9、数据治理做了哪些工作10、为什么要离职11、未来的发展方向自己的3-5年规划是什么12、Ai赋能工作有没有心得体会13、介绍自己的三个优点三个缺点14、为什么上家半年就离职15、质量布控中发现上游系统有问题如何去推动其他项目组协调解决如果一两个月都没推动你又该怎么解决反问1、团队定位及工作职责是什么业务是否稳定2、个人职责会不会有分散既要做这个又要做另外的3、内部有活水但前提是一年以上稳定。其实AI时代岗位都不会原地消失而是岗位的标准会被逐步抬高当然行业本质其实还是不变的 AI,不是AI替换所有。未来3年内很多岗位都会被AI,借助AI被重塑。就像数据开发岗未来也会被AI重塑我们会借助AI提效比如“智能问数”会逐步替换很多的基础的数据分析岗SQL取数岗BI看板搭建岗位一个人可以借助大模型AI的工具更加多快好省的干活哈意味着越来越卷。当然我们也会借助AI进行任务诊断数据治理也会借助AI做集群监控管理所以我们需要去拥抱AI大数据。但是岗位本质不变还是对海量数据的存储与海量数据的计算。其他后端岗位产品经理数据分析运维安全算法都是一样都会被AI重塑这些岗位。涤生的AI大模型大厂研发提效系列打磨录制中很快也会上线了哈