经典面试题-大厂SQL题目

正确:

数据分析sql面试必会6题经典 数据分析mysql面试题数据分析sql面试必会6题经典 数据分析mysql面试题


数据分析sql面试必会6题经典 数据分析mysql面试题


数据分析sql面试必会6题经典 数据分析mysql面试题


正确:

给定 Employee 表,编写一个 SQL 查询,该查询可以获取收入超过他们的员工的姓名。在上面的表格中,Joe 是一个收入超过他的的员工。

正确:

Customers 表:

Orders 表:

例如给定上述表格,你的查询应返回:

正确:

例如,给定上面的 Logs 表, 1 是连续出现至少三次的数字。

正确:

或者

例如,根据上述给定的 Scores 表,你的查询应该返回(按分数从高到低排列):

正确:

例如上述 Employee 表,n = 2 时,应返回第二高的薪水 200。如果不存在第 n 高的薪水,那么查询应返回 null。

正确:

示例:

如数据输入的是上表,则输出结果如下:

注意:

如果学生人数是奇数,则不需要改变一个同学的座位。

正确:

例如,根据上述给定的 Weather 表格,返回如下 Id:

正确:

Employee 表包含所有员工信息,每个员工有其对应的 Id, salary 和 department Id。

Department 表包含公司所有部门的信息。

编写一个 SQL 查询,找出每个部门工资的员工。例如,根据上述给定的表格,Max 在 IT 部门有工资,Henry 在 Sales 部门有工资。

正确:

表1: Person

PersonId 是上表主键

表2: Address

AddressId 是上表主键

编写一个 SQL 查询,满足条件:无论 person 是否有地址信息,都需要基于上述两表提供 person 的以下信息:

FirstName, LastName, City, State

正确:

注意,您必只能写一个 Update 语句,请不要编写任何 Select 语句。

例如:

运行你所编写的更新语句之后,将会得到以下表:

正确:

这里有张 World 表

如果一个的面积超过300万平方公里,或者人口超过0万,那么这个就是大。

编写一个SQL查询,输出表中所有大的名称、人口和面积。

例如,根据上表,我们应该输出:

正确:

Id 是这个表的主键。

例如,在运行你的查询语句之后,上面的 Person 表应返回以下几行:

正确:

Employee 表包含所有员工信息,每个员工有其对应的 Id, salary 和 department Id 。

Department 表包含公司所有部门的信息。

编写一个 SQL 查询,找出每个部门工资前三高的员工。例如,根据上述给定的表格,查询结果应返回:

正确

例如上述 Employee 表,SQL查询应该返回 200 作为第二高的薪水。如果不存在第二高的薪水,那么查询应返回 null。

正确:

例如,下表 cinema:

对于上面的例子,则正确的输出是为:

正确:

请列出所有超过或等于5名学生的课。

例如,表:

应该输出:

Note:

学生在每个课中不应被重复计算。

正确:

Users 表存所有用户。每个用户有键 Users_Id。Banned 表示这个用户是否被禁止,Role 则是一个表示(‘client’, ‘driver’, ‘partner’)的枚举类型。

写一段 SQL 语句查出 2013年10月1日 至 2013年10月3日 期间非禁止用户的取消率。基于上表,你的 SQL 语句应返回如下结果,取消率(Cancellation Rate)保留两位小数。

正确

示例:

根据以上输入,你的查询应返回以下结果:

说明:所有电子邮箱都是小写字母。

正确:

请编写一个查询语句,找出高峰期时段,要求连续三天及以上,并且每天量均不少于100。

例如,表 stadium:

对于上面的示例数据,输出为:

Note:

每天只有一行记录,日期随着 id 的增加而增加。

正确:

经典sql面试题及第10期

create proc 存储过程名

[@参数名 参数类型[, @参数名 参数类型...]]

as

批处理语句

go

alter proc 存储过程名

[@参数名 参数类型[, @参数名 参数类型...]]

as

批处理语句

go

drop proc 存储过程名

exec proc 存储过程名 [参数值[, 参数值...]]

不一样,加括号是执行sql语句,不加括号是执行存储过程。

a. 以Return传回整数

b. 以output格式传回参数

c. Recordset

返回值的区别: output和return都可在批次程式中用变量接收,而recordset则传回到执行批次的客户端中。

create proc queryPage

@tablename nvarchar(50), --用于传入表名

@idname nvarchar(50), --用于传入字段名

@pagesize int, --用于传入每页记录数

@currentpage int, --用于传入希望查看的页面编号

@totalpages int output --用于传出页面总数

as

--声明保存查询语句的局部变量:

declare @sql as nvarchar(1000)

--声明保存记录总数的局部变量:

declare @rowcount as int

--获得记录总数:

set @sql='select @rc=count() from '+@tablename --不要直接执行select @rowcount=count() from @tablename

--将参数传入语句:

exec sp_executesql @sql,N'@rc int output',@rc=@rowcount output

--将根据每页的行数得到的总页数保存到输出参数中:

set @totalpages = ceiling(cast(@rowcount as float)/cast(@pagesize as float))

if @currentpage >1

begin if @currentpage>@totalpages

begin set @currentpage = @totalpages --则显示一页

end

set @sql = 'select top '+cast(@pagesize as varchar) +' from '+@tablename+' where '+@idname+' not in (select top ' +cast(@pagesize(@currentpage-1) as varchar) +' '+@idname+' from '+@tablename+' order by '+@idname+') order by '+@idname

end else --只选页就不必使用子查询了,提高性能

begin set @sql = 'select top '+cast(@pagesize as varchar) +' from '+@tablename+' order by '+@idname

end exec(@sql) --执行查询语句

go

数据分析师常见的面试问题

关于数据分析师常见的面试问题集锦

1、你处理过的的数据量?你是如何处理他们的?处理的结果。

2、告诉我二个分析或者计算机科学相关项目?你是如何对其结果进行衡量的?

3、什么是:提升值、关键绩效指标、强壮性、模型按合度、实验设计、2/8原则?

4、什么是:协同过滤、n-grams, map reduce、余弦距离?

5、如何让一个网络爬虫速度更快、抽取更好的信息以及更好总结数据从而得到一干净的数据库?

6、如何设计一个解决抄袭的方案?

7、如何检验一个个人支付账户都多个人使用?

8、点击流数据应该是实时处理?为什么?哪部分应该实时处理?

9、你认为哪个更好:是好的数据还是好模型?同时你是如何定义“好”?存在所有情况下通用的模型吗?有你没有知道一些模型的定义并不是那么好?

10、什么是概率合并(aka模糊融合)?使用sql处理还是其它语言方便?对于处理半结构化的数据你会选择使用哪种语言?

11、你是如何处理缺少数据的?你使用什么样的处理技术?

12、你喜欢的编程语言是什么?为什么?

13、对于你喜欢的统计软件告诉你喜欢的与不喜欢的3个理由。

14、sas, r, python, perl语言的区别是?

15、什么是大数据的诅咒?

16、你参与过数据库与数据模型的设计吗?

17、你是否参与过仪表盘的设计及指标选择?你对于商业智能和报表工具有什么想法?

18、你喜欢td数据库的什么特征?

19、如何你打算发100万的营销活动邮件。你怎么去优化发送?你怎么优化反应率?能把这二个优化份开吗?

20、如果有几个客户查询oracle数据库的效率很低。为什么?你做什么可以提高速度10倍以上,同时可以更好处理大数量输出?

21、如何把非结构化的数据转换成结构化的数据?这是否真的有必要做这样的转换?把数据存成平面文本文件是否比存成关系数据库更好?

22、什么是哈希表碰撞攻击?怎么避免?发生的频率是多少?

23、如何判别mapreduce过程有好的负载均衡?什么是负载均衡?

24、请举例说明mapreduce是如何工作的?在什么应用场景下工作的很好?云的安全问题有哪些?

25、(在内存满足的情况下)你认为是100个小的哈希表好还是一个大的哈希表,对于内在或者运行速度来说?对于数据库分析的评价?

26、为什么朴素贝叶斯?你如何使用朴素贝叶斯来改进爬虫检验算法?

27、你处理过白名单吗?主要的规则?(在欺诈或者爬行检验的情况下)

28、什么是星型模型?什么是查询表?

29、你可以使用excel建立逻辑回归模型吗?如何可以,说明一下建立过程?

30、在sql, perl, c++, python等编程过程上,待为了提升速度优化过相关代码或者算法吗?如何及提升多少?

31、使用5天完成90%的精度的解决方案还是花10天完成的精度的解决方案?取决于什么内容?

32、定义:qa(质量保障)、六西格玛、实验设计。好的与坏的实验设计能否举个案例?

33、普通线性回归模型的缺陷是什么?你知道的其它回归模型吗?

34、你认为叶数小于50的决策树是否比大的好?为什么?

35、保险精算是否是统计学的一个分支?如果不是,为何如何?

36、给出一个不符合高斯分布与不符合对数正态分布的数据案例。给出一个分布非常混乱的数案例。

37、为什么说均方误不是一个衡量模型的好指标?你建议用哪个指标替代?

38、你如何证明你带来的算法改进是真的有效的与不做任何改变相比?你对a/b测试熟吗?

39、什么是敏感性分析?拥有更低的敏感性(也就是说更好的强壮性)和低的预测能力还是正好相反好?你如何使用交叉验证?你对于在数据集中插入噪声数据从而来检验模型的.敏感性的想法如何看?

40、对于一下逻辑回归、决策树、神经网络。在过去XX年中这些技术做了哪些大的改进?

41、除了主成分分析外你还使用其它数据降维技术吗?你怎么想逐步回归?你熟悉的逐步回归技术有哪些?什么时候完整的数据要比降维的数据或者样本好?

42、你如何建议一个非参数置信区间?

43、你熟悉极值理论、蒙特卡罗逻辑或者其它数理统计方法以正确的评估一个稀疏的发生概率?

44、什么是归因分析?如何识别归因与相关系数?举例。

45、如何定义与衡量一个指标的预测能力?

46、如何为欺诈检验得分技术发现的规则集?你如何处理规则冗余、规则发现和二者的本质问题?一个规则集的近似解决方案是否可行?如何寻找一个可行的近似方案?你如何决定这个解决方案足够好从而可以停止寻找另一个更好的?

47、如何创建一个关键字分类?

48、什么是僵尸网络?如何进行检测?

49、你有使用过api接口的经验吗?什么样的api?是谷歌还是亚马逊还是软件即时服务?

50、什么时候自己编号代码比使用数据科学者开发好的软件包更好?

51、可视化使用什么工具?在作图方面,你如何评价tableau?r?sas?在一个图中有效展现五个维度?

52、什么是概念验证?

53、你主要与什么样的客户共事:内部、外部、销售部门/财务部门/市场部门/it部门的人?有咨询经验吗?与供应商打过交道,包括供应商选择与测试。

54、你熟悉软件生命周期吗?及it项目的生命周期,从收入需求到项目维护?

55、什么是cron任务?

56、你是一个独身的编码人员?还是一个开发人员?或者是一个设计人员?

57、是阳性好还是阴性好?

58、你熟悉价格优化、价格弹性、存货管理、竞争智能吗?分别给案例。

59、zillow’s算法是如何工作的?

60、如何检验为了不好的目的还进行的虚评论或者虚的fb帐户?

61、你如何创建一个新的匿名数字帐户?

62、你有没有想过自己创业?是什么样的想法?

63、你认为帐号与密码输入的登录框会消失吗?它将会被什么替代?

64、你用过时间序列模型吗?时滞的相关性?相关图?光谱分析?信号处理与过滤技术?在什么样的场景下?

65、哪位数据科学有你佩服?从哪开始?

66、你是怎么开始对数据科学感兴趣的?

67、什么是效率曲线?他们的缺陷是什么,你如何克服这些缺陷?

68、什么是引擎?它是如何工作的?

69、什么是精密测试?如何及什么时候模拟可以帮忙我们不使用精密测试?

70、你认为怎么才能成为一个好的数据科学家?

71、你认为数据科学家是一个艺术家还是科学家?

72、什么是一个好的、快速的聚类算法的的计算复杂度?什么好的聚类算法?你怎么决定一个聚类的聚数?

73、给出一些在数据科学中“实践的案例”。

74、什么让一个图形使人产生误解、很难去读懂或者解释?一个有用的图形的特征?

75、你知道使用在统计或者计算科学中的“经验法则”吗?或者在商业分析中。

76、你觉得下一个20年的5个预测方法是?

77、你怎么马上就知道在一篇文章中(比如报纸)发表的统计数字是错误,或者是用作支撑作者的论点,而不是仅仅在罗列某个事物的信息?例如,对于每月定期在媒体公开发布的失业统计数据,你有什么感想?怎样可以让这些数据更加准确?

;

数据库经典笔试题和面试题

如下这些有关数据库知识考查的经典笔试题,非常全面,对计算机专业毕业生参加笔试会很有帮助,建议大家收藏。

一、选择题

1. 下面叙述正确的是___c___。

A、算法的执行效率与数据的存储结构无关

B、算法的空间复杂度是指算法程序中指令(或语句)的条数

C、算法的有穷性是指算法必须能在执行有限个步骤之后终止

D、以上三种描述都不对

2. 以下数据结构中不属于线性数据结构的是___c___。

A、队列B、线性表C、二叉树D、栈

3. 在一棵二叉树上第5层的结点数多是__b____。2的(5-1)次方

A、8 B、16 C、32 D、15

4. 下面描述中,符合结构化程序设计风格的是___a___。

A、使用顺序、选择和重复(循环)三种基本控制结构表示程序的控制逻辑

B、模块只有一个入口,可以有多个出口

C、注重提高程序的执行效率 D、不使用goto语句

5. 下面概念中,不属于面向对象方法的是___d___。

A、对象 B、继承 C、类 D、过程调用

6. 在结构化方法中,用数据流程图(DFD)作为描述工具的软件开发阶段是___b___。

A、可行性分析 B、需求分析 C、详细设计 D、程序编码

7. 在软件开发中,下面任务不属于设计阶段的是__d____。

A、数据结构设计 B、给出系统模块结构 C、定义模块算法 D、定义需求并建立系统模型

8. 数据库系统的核心是___b___。

A、数据模型 B、数据库管理系统 C、软件工具 D、数据库

9. 下列叙述中正确的是__c____。

A、数据库是一个的系统,不需要作系统的支持

B、数据库设计是指设计数据库管理系统

C、数据库技术的根本目标是要解决数据共享的问题

D、数据库系统中,数据的物理结构必须与逻辑结构一致

10. 下列模式中,能够给出数据库物理存储结构与物理存取方法的是___a___。

A、内模式 B、外模式 C、概念模式 D、逻辑模式

11. Visual FoxPro数据库文件是___d___。

A、存放用户数据的文件 B、管理数据库对象的系统文件

C、存放用户数据和系统的文件 D、前三种说法都对

12. SQL语句中修改表结构的命令是___c___。

A、MODIFY TABLE B、MODIFY STRUCTURE

C、ALTER TABLE D、ALTER STRUCTURE

13. 如果要创建一个数据组分组报表,个分组表达式是"部门",第二个分组表达式是"性别",第三个分组表达式是"基本工资",当前索引的索引表达式应当是__b____。

A、部门+性别+基本工资 B、部门+性别+STR(基本工资)

C、STR(基本工资)+性别+部门 D、性别+部门+STR(基本工资)

14. 把一个项目编译成一个应用程序时,下面的叙述正确的是___a___。

A、所有的项目文件将组合为一个单一的应用程序文件

B、所有项目的包含文件将组合为一个单一的应用程序文件

C、所有项目排除的文件将组合为一个单一的应用程序文件

D、由用户选定的项目文件将组合为一个单一的应用程序文件

15. 数据库DB、数据库系统DBS、数据库管理系统DBMS三者之间的关系是_a___。

A、DBS包括DB和DBMS B、DBMS包括DB和DBS

C、DB包括DBS和DBMS D、DBS就是DB,也就是DBMS

16. 在"选项"对话框的"文件位置"选项卡中可以设置___b___。

A、表单的默认大小 B、默认目录

C、日期和时间的显示格式 D、程序代码的颜色

17. 要控制两个表中数据的完整性和一致性可以设置"参照完整性",要求这两个表_a_。

A、是同一个数据库中的两个表 B、不同数据库中的两个表

C、两个自由表 D、一个是数据库表另一个是自由表

18. 定位条记录上的命令是___a___。

A、GO TOP B、GO BOTTOM C、GO 6 D、SKIP

19. 在关系模型中,实现"关系中不允许出现相同的元组"的约束是通过__b____。

A、候选键 B、主键 C、外键 D、超键

20. 设当前数据库有10条记录(记录未进行任何索引),在下列三种情况下,当前记录号为1时;EOF()为真时;BOF()为真时,命令?RECN()的结果分别是___a___。

A、1,11,1 B、1,10,1 C、1,11,0 D、1,10,0

21. 下列表达式中结果不是日期型的是___c___。

A、CTOD("2000/10/01") B、{^99/10/01}+365

C、VAL("2000/10/01") D、DATE()

22. 只有满足联接条件的记录才包含在查询结果中,这种联接为___c___。

A、左联接 B、右联接 C、内部联接 D、完全联接

23. 索引字段值不,应该选择的索引类型为___b___。

A、主索引 B、普通索引 C、候选索引 D、索引

24. 执行SELECT 0选择工作区的结果是___b___。

A、选择了0号工作区 B、选择了空闲的小号工作区

C、关闭选择的工作区 D、选择已打开的工作区

25. 从数据库中删除表的命令是___a___。

A、DROP TABLE B、ALTER TABLE C、DELETE TABLE D、USE

26. DELETE FROM S WHERE 年龄>60语句的功能是__b____。

A、从S表中删除年龄大于60岁的记录

B、S表中年龄大于60岁的记录被加上删除标记

C、删除S表 D、删除S表的年龄列 1 2

Mysql|数据分析搞懂这15道SQL题目笔试就稳了

现有以下三张表

写出SQL语句:查询产品名称=“A品”,在医院2018~2019两年的销售“金额”,排除两年销售金额总和>1000000的医院,要求查询结果如下表。

写出SQL语句,查询题1的销量表中2019年任意连续三个月销售额都>0的医院。

返回字段:HospitalId,SalesMonth(2019年销量>0的所有月份,逗号隔开)

以下是微信聊天记录表

写出SQL语句:按月统计2020年的微信回复率

发送次数 = 一组好友在一个自然天内的所有发送记录计为1次。

回复率计算公式 =(发送次数在两个自然天内被回复)/发送次数

未完。。。 持续更新中。。。