统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。随着现代科学技术尤其是计算机、网络信息等技术的快速发展,海量数据在自然科学和社会科学各个领域涌现出来,并以前所未有的速度产生和积累。
这些海量数据涵盖范围广,变化速度快,存在形式复杂多样,同时也蕴含了丰富的价值。出现数据的地方就离不开统计,如何对这些杂乱无章的数据进行挖掘,寻找数据背后隐藏的规律性,利用已有数据进行决策等等,这些都离不开统计工具的支撑。
统计学为大数据进行数据价值化奠定了一定的基础,在现代社会中发挥着越来越重要的作用。
统计学在经济、管理、金融、医学、心理学乃至物理领域都有广泛的应用,统计学的应用对政府决策、社会运行,乃至我们的工作和生活都有直接或间接的影响,这种影响远远超乎我们的想象。比如,证券分析师需要有统计学知识,才能构建分析模型预测未来的股票、债券价格走势;医疗领域的专家需要有统计学知识,才能了解医学研究报告的内容;职业经理人需要有统计学知识,才能将复杂的市场数据有效浓缩,寻找规律,辅助商业决策。
统计学是高等教育中经济、管理、金融、商科、医学、社会学、心理学等专业方向的基础课,也是处理相应学科数据、撰写学科论文的必备工具,是非常重要的一门学科。在同学们未来的专业学习中,如何对本专业相关数据进行处理、挖掘、推断、结果分析等等,都离不开统计学知识。
本篇文章主要介绍以下几方面的内容:
1.AP统计学考查哪些内容
AP统计学,是美国大学的先修课程,是为大学的统计学学习奠定基础的。AP统计学与大学的统计学课程在核心内容上是一致的,只是涉及的深度稍浅,AP统计学主要包含以下四部分内容。
第一部分
如何获取数据,获取数据的方式有哪些呢?获取数据的方式主要包括普查、抽样调查、观测研究和实验设计等。
第二部分
探索性数据分析。当通过数据获取的手段获得相应数据后,这些数据相对杂乱无章,如何对海量数据进行初步整理,找出规律,是这部分的内容。主要包括分类变量分析和数值型变量分析。分类变量分析主要包括对分类变量的数据建立频数分布表、条形图、饼图等。数值型变量分析主要包括对集中程度的衡量、离散程度的衡量、位置的衡量、点图、茎叶图、直方图、箱线图、散点图、相关系数以及建立线性回归模型等。
第三部分
概率和概率分布的内容。主要包括如何利用事件发生的概率处理不确定性,涵盖的内容包括概率、概率分布如二项分布、几何分布、正态分布、抽样分布等。
第四部分
统计推断。主要包括如何利用已经获取到的数据进行推断,主要包括参数估计和假设检验。比如,我们可以利用我国GDP的历史数据,预测一下未来几年GDP的大致发展情况。
2019年College Board给出了新的AP统计学考试说明(2020年又更新了一版),其中对AP统计学的考试单元进行了更为详细的划分, 将考试内容分成了9单元,但这些内容都涵盖在了上面的四部分统计学内容分类之中。详细的考试内容划分可参见下表(其中的内容占比官方指出这是在选择题部分中各单元的占比情况):
Unit1exploring one-variable data(15%-23%)
这部分是对单变量数据的探索性分析,主要内容涉及到单变量分类数据的分析以及单变量数值型变量的分析。这部分考试的重点在单变量数值型变量上,特别是点图、茎叶图、直方图以及箱线图,以及结合图形描述或者对比数据分布,需要重点掌握,特别是考到简答题时,要在抓住核心考点基础上,进行充分、全面的文字说明。
Unit2exploring two-variable data(5%-7%)
这部分内容是对双变量数据的探索性分析,内容涉及到双变量分类数据的分析以及双变量数值型变量的分析。要对展示双变量分类数据的two-way table以及对比条形图,还有与概率部分结合的考点重点掌握。双变量数值型变量的分析,主要考查散点图(scatterplot)、相关系数(correlation)以及最小二乘回归线,大部分的题目都有一定规律,偶尔会在最小二乘回归线这里有发散性的考法,略有难度。
Unit3collecting data(12%-15%)
这部分主要是考查统计如何获取数据的方法,普查、抽样调查、观测研究以及实验。其中重点考点集中在抽样调查和实验,这部分简答题一般会考一道题,需要大家了解每一个基本概念,简答题要掌握一些固定的答法,本部分基本不涉及到计算类的题目。
Unit4probability, random variables, and probability distributions(10%-20%)
这部分是概率、随机变量及其概率分布。重点考点为常见事件发生的概率,离散型随机变量及概率分布,特别是二项分布、几何分布,连续型随机变量及概率分布,以及统计中最重要的一个分布:正态分布,本部分还有独立随机变量组合的考点。计算类的题目较多,考法非常灵活,难点主要集中在正态分布以及其与独立随机变量组合的结合类考点。本部分占比为10%-20%,看似不高,但是本部分是后面章节的基础,所以必须要学的非常扎实,不然后面部分的理解应用会很有难度。
Unit5sampling distribution(7%-12%)
本部分是抽样分布,是整个统计学中相对抽象的一章,理解有难度,一定要在理解的基础上进行掌握。这部分主要涉及样本均值、样本均值差、样本比例、样本比例差的抽样分布,单独考查的考点主要集中的样本均值以及样本比例的抽分布。但是这部分与第四单元一样,也是后面章节的基础,所以必须要在理解透彻的基础上进行应用。
Unit6inference for categorical data: proportions(12%-15%)
本部分是对比例的推断。主要包括总体比例、总体比例差的置信区间估计,以及总体比例、总体比例差的假设检验。考点比较多,但是题目的类型有规律性,在掌握了规律的基础上,难度并不大。
Unit7inference for quantitative data: means(10%-18%)
本部分是对均值的推断。主要包括总体均值、总体均值差的置信区间估计,以及总体均值、总体均值差的假设检验。本单元与第6单元同样考点较多,但出题有规律性。
Unit8inference for categorical data: chi-square(2%-5%)
本单元主要包括chi-square test ofgoodness of fit,chi-square test of independence以及chi-square test for homogeneity of proportions,引入了一个新的分布chi-square分布,考点也会结合第一单元和第二单元一起联合考查。
Unit9Inference for quantitative data: slopes(2%-5%)
本单元是对最小二乘回归线中对应总体方程的斜率进行推断,主要包括置信区间估计和假设检验,考点有规律性,没有太大的难度。
2. AP统计学的考试形式和时间,考试难度如何?
2024年常规AP统计学的考试时间是2024年5月7日下午约12点(当地时间),延迟考试时间为2024年5月22日上午8点(当地时间)。考试共计3小时,包括选择题和自由问答题两部分,具体的考试形式和时间见下表。2025年的考试时间还未出,应该也在5月初。
AP统计学卷面分数100分,每年卷面分数到AP 5分的换算都有小幅的波动,但基本维持在60-70分之间,所以要想考到AP 5分,卷面保证达到70分就可以。下面给出大家2019年AP统计学的分数转换,可以作为参考。
2021年-2023年全球AP统计学考试情况如下:
从考试情况数据来看,AP统计学的5分率并不算很高,但是是否就如某些同学想的,“统计学是一个十分难的科目,需要花费大量的时间来准备呢?”这实际上是一个误区。任何AP科目的备考都是要有一定准备时间的,都需要投入相对充分的时间和精力。虽然统计学对同学们来讲是一个相对新的领域,只要在复习的时候认真对待,充分理解透彻每个概念,掌握好规律性的答题做法,对典型真题能顾做到举一反三,那么对于每位同学来讲,只要做到效率高、学习方向准确,是不需要额外花费大量时间来备考的,并且也一定能成为5分中的一员。
3. 哪些同学应该学AP统计学?
由于统计学用到了大量的数学及其它学科的专业知识,且其应用范围几乎覆盖了社会科学和自然科学的各个领域。因此绝大部分大学专业都会用到,因此建议同学们在高中阶段,如果学有余力,都应该学习AP统计学,简单来讲,就是必须学并且尽早学!
对于高一高二的同学(美高9-11年级的同学):
一方面,AP统计学的学习对SAT的备考有很好的助力:AP统计学的学习完全可以覆盖SAT数学中涉及到统计的内容,在备考SAT数学时,在这部分内容上可以花费较少的时间,并且掌握到全部的知识点和考点,达到事半功倍的效果,还可以应对考试中涉及统计学考查时,很多同学认为内容超纲(比如做之前题目没有出现过类似的题目)的情况。
这里举个例子,
在SAT数学中会考查到边际误差(margin of error),可能大部分同学看到题目可以选出答案,但一旦考查内容有变化或者难度有增加,很多同学就不知所措,认为超纲了,题目好难,但实际上这些内容在AP统计中都是完整呈现的系统性知识,对于学过统计学的同学来讲,这些题目的解答是手到擒来的。另一方面,AP统计学的学习对于大学申请可以增色不少,为同学们申请名校添砖加瓦。首先,AP统计学在理科方向属于难度偏高,五分率相对较低的科目,如果能够取得较好的AP成绩,将是同学们学术能力的良好体现;其次,在申请材料中如果所呈现的专业兴趣和统计学相关性比较大,比如经济、管理、金融、商科等等,那么AP统计学的学习,也将可以诠释自己在专业方向上的积极储备,为招生官展现自己了解专业兴趣所涉及的学科,并为之付出了充分的努力。
对于高三同学(美高12年级同学):很多高三同学会问“老师,你看我们现在学申请上也用不到了,是不是就不用学了?”申请大学确实用不到了,但是在高三阶段学习AP课程还是很有必要的:
一是可以打好学科基础。
对于高三同学来讲,进入大学是一个从高中到大学的转变,各方面都需要适应,那么如果我们利用好上大学之前的这段宝贵的时间,把统计的内容掌握好,在未来我们大学统计学课程上,就不会占据太多的时间,考试也可以相对轻松地拿到A的成绩。
二是提供了换学分或是跳过基础课程的选择。
如果AP考试拿到了较好的成绩,在进入大学后,可以根据自己的专业兴趣方向,以及自己之前在该学科的学习基础,选择把相应课程的学分换掉,或是跳过该学科的基础课程,这样可以更为合理、高效地安排大学阶段学习。
因此对于高三的同学来讲,在申请结束到进入大学的这段相对充裕的时间里,我非常建议大家来参加AP统计学的学习,你会发现到了大学之后学的太多内容都离不开统计的支撑,比如大家常会接触到的计量经济学。
最近几年,上了大学的同学们也都时常会跟我联系聊一聊大学里的学习生活,不少同学反馈高中阶段学了AP统计学之后,在大学中的统计学习相对轻松,考试也比较得心应手。也有一部分没有学AP统计学的同学会跟我分享,自己在大学的学习有些吃力。
我还有一些学生是大一、大二的同学,因为课上很多概念性的知识听不懂,导致自己整个学科没有建立完整的框架体系、对统计学没有形成系统认识,GPA成绩很一般,只好选择线上远程补课。
同时,如果同学们有跟在国外上大学的师兄师姐有联系的话,你也会发现选择统计学作为主修专业或者第二专业的同学真的很多,还有很多同学选择data science,你会发现统计在学习生活中的应用真的很多很广。
4. 怎样学习和备考AP统计学?
有很多时候,我们都把考试作为检验自己学习成果的唯一方式了,甚至觉得考5分就等于掌握了这门学科。实则不然,考试考5分和掌握透彻一门学科往往不同。我们要把考试得5分设为一个小目标,把掌握这门学科作为学习的终极目标。通过我们的努力,在实现终极目标的过程中,考试拿到5分自然是一个水到渠成的事情。
下面我们分成三种不同类型来告诉大家应该如何学习和备考AP统计学。
(一)学校有开设AP统计学课程的同学
如果你的学校正在开设AP统计学课程,并且老师在讲解的时候不是很“水”,能够讲明白每个知识点的话,那就要跟紧学校的进度。学校开设课程有一个比较明显的好处就是课程时间长,给大家留出了相对充分的理解和吸收时间,但是这里提醒大家注意,一定要按时保质保量的完成老师布置的学习任务,有问题一定要跟老师多讨论,将自己的疑问解决掉。
(最近有跟学校开设统计学课程的同学聊天,她说学校里老师讲的听不太懂,但是也不好意思提问,总觉得是自己的问题,没有理解知识点,所以千万不要不懂装懂,等累积的问题越来越多的时候,你的有效学习效率会很低,这也是为什么很多同学花了大量时间学习,但是考试成绩依然不理想的原因)。
统计学的知识点前后之间是有联系的,甚至有的章节内容是后面章节的基础,所以如果一旦没有跟上,可能会导致后面整块内容都学的稀里糊涂。不过这里提醒大家注意,有一些学校的AP统计学课程不太重视真题练习,同学们一定要利用时间大量做真题练习,总结出题规律,总结易错点,准备一个典型错题的错题本,可以在考前重点复习,做好这些是同学们顺利考5分的重要保证。
(二)如果你的事情不是特别多,想通过自学来完成AP统计学的备考
首先也是最重要的一点,大家一定要选择一本靠谱的自学用教材或者参考书。现在很多学校里用教材《The practice of Statistics》(俗称火烈鸟教材),这本教材有一个优点是对每一个概念都进行了大量的文字解释,并且配备了很多的题目练习。也有一个最大的缺点,就是章节的排列会让同学们迷惑,比如有的章节内容明明用到了后面章节中学到的知识点,这就会导致同学们在自学过程中,很难自己真正吃透这些联系。
目前市面上大家能想到的教材有:普林斯顿、巴朗、开普兰、McGraw Hill等一系列教材。
这些教材对知识点的介绍都讲解的十分细致,但是分成的几个主题(特别是前面的几个主题),内容逻辑性不够强,同学们要想形成系统性的框架有难度,题目跟真题的出题方式有一定的差异性,但是有些题目也出的比较好,可以在老师给画出一些大致范围的前提下,进行练习。
(三)选择参加辅导班的同学,一定要慎重选择靠谱的、有经验的机构和老师!
虽然AP统计学是美国大学先修课程,是大家在高中阶段学习的课程,但由于统计学在未来学习生活的重要性,对于大家来讲,统计学是一个相对来讲比较新的领域,也是大家未来在本科、研究生阶段学习的入门和基础,所以打好基础、培养充分的学习兴趣是十分重要的。
有经验的老师,不仅能够将知识点讲解的清楚,每个知识点都有哪些具体的考点都能列出来给大家,总结出典型的规律和作答方式,还能将繁杂、难理解的知识点和考点用通俗、简单、易懂的方式让大家来吸收和接受,将不同知识点之间产生的内在联系给剖析清楚。
在考前的复习阶段,可以以题带点,通过一道题,延伸出该知识点的多种典型考法,这样才能更高效的帮助大家少走弯路,相对轻松地备考。大家应该选择的就是这样的老师,让大家能够对貌似复杂的知识点,都能相对轻松的理解清楚,也让大家在学习过程中不痛苦,既快乐学习,又掌握的足够好。