<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
	<id>https://wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=Statistics_4mr_2021-22</id>
	<title>Statistics 4mr 2021-22 - История изменений</title>
	<link rel="self" type="application/atom+xml" href="https://wikicshse.ru/index.php?action=history&amp;feed=atom&amp;title=Statistics_4mr_2021-22"/>
	<link rel="alternate" type="text/html" href="https://wikicshse.ru/index.php?title=Statistics_4mr_2021-22&amp;action=history"/>
	<updated>2026-06-06T14:43:26Z</updated>
	<subtitle>История изменений этой страницы в вики</subtitle>
	<generator>MediaWiki 1.45.3</generator>
	<entry>
		<id>https://wikicshse.ru/index.php?title=Statistics_4mr_2021-22&amp;diff=720&amp;oldid=prev</id>
		<title>imported&gt;Bdemeshev: Migrated current public revision from wiki.cs.hse.ru</title>
		<link rel="alternate" type="text/html" href="https://wikicshse.ru/index.php?title=Statistics_4mr_2021-22&amp;diff=720&amp;oldid=prev"/>
		<updated>2022-04-28T18:58:06Z</updated>

		<summary type="html">&lt;p&gt;Migrated current public revision from wiki.cs.hse.ru&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Новая страница&lt;/b&gt;&lt;/p&gt;&lt;div&gt;== О курсе ==&lt;br /&gt;
[https://www.youtube.com/channel/UC8PQpPltnaMvlr6g1wkkTqw/featured Youtube-канал с лекциями]&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Оценивание&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
UoL = Экзамен * 0.7 + Письменная (или курсовая) работа * 0.3 &lt;br /&gt;
&lt;br /&gt;
Итоговая оценка = Экзамен * 0.5 + 0.3 * Контрольная работа + 0.2 * Домашняя работа &lt;br /&gt;
&lt;br /&gt;
==== Module 1 ====&lt;br /&gt;
(1 lecture + 1 class per group X 7 weeks)&lt;br /&gt;
&lt;br /&gt;
* Bootstrap&lt;br /&gt;
* Welch test&lt;br /&gt;
* Mann-Whitney test&lt;br /&gt;
* CUPED&lt;br /&gt;
* Difference in Difference estimator&lt;br /&gt;
* Matching&lt;br /&gt;
* Multiple comparison corrections&lt;br /&gt;
&lt;br /&gt;
==== Module 2 ====&lt;br /&gt;
(1 lecture + 1 class per group X 8 weeks)&lt;br /&gt;
* Sampling&lt;br /&gt;
* Sample size calculation&lt;br /&gt;
* Contingency tables, Chi-squared tests&lt;br /&gt;
* ANOVA, ANCOVA&lt;br /&gt;
* Partial correlation&lt;br /&gt;
&lt;br /&gt;
==== Module 3 ====&lt;br /&gt;
(1 lecture + 1 class per group X 11 weeks)&lt;br /&gt;
* Discriminant analysis&lt;br /&gt;
* Logit&lt;br /&gt;
* PCA&lt;br /&gt;
* Factor analysis&lt;br /&gt;
* Cluster analysis, Dendrogramms&lt;br /&gt;
* Conjoint Analysis&lt;br /&gt;
* Multidimensional scaling&lt;br /&gt;
&lt;br /&gt;
== Литература ==&lt;br /&gt;
Вспоминаем тервер и матстат &lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;Книжки попроще&amp;#039;&amp;#039;&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Frederick Gravetter, Larry Wallnau. Statistics for the Behavioral Sciences&amp;#039;&amp;#039;&amp;#039; &lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Феллер В. Введение в теорию вероятностей и её приложения&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;Посложнее&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Larry Wasserman. All of Statistics: A Concise Course in Statistical Inference&amp;#039;&amp;#039;&amp;#039; &lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;David Williams. Weighing the Odds. A Course in Probability and Statistics&amp;#039;&amp;#039;&amp;#039; &lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Ширяев А.Н. Вероятность - 1&amp;#039;&amp;#039;&amp;#039; .&lt;br /&gt;
&lt;br /&gt;
Советы от UoL&lt;br /&gt;
* &amp;#039;&amp;#039;&amp;#039;Malhotra, N.K. D.F. Birks and P.A. Wills Marketing Research, Pearson, fourth edition&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
== Боевой листок: семестр I ==&lt;br /&gt;
==== Лекция 1. Наивный bootstrap, bootstrap t-статистики, bootstrap в bootstrap ====&lt;br /&gt;
[https://www.youtube.com/watch?v=wIPq_OoYcjc Запись лекции]&lt;br /&gt;
&lt;br /&gt;
Полезно почитать:&lt;br /&gt;
* Tim Hestenberg, [https://arxiv.org/abs/1411.5279 What teachers should know about the bootstrap]&lt;br /&gt;
* [https://people.eecs.berkeley.edu/~jordan/sail/readings/edgeworth.pdf Edgeworth expansion]&lt;br /&gt;
Тетрадка с семинара: &lt;br /&gt;
* [https://github.com/xenakas/stat4mr_2021/tree/main/seminar1 bootstrap_part1]&lt;br /&gt;
&lt;br /&gt;
==== Лекция 2. Дикий bootstrap, парный bootstrap, пуассоновский bootstrap ====&lt;br /&gt;
[https://youtu.be/1cJzSioPAjM Запись лекции]&lt;br /&gt;
&lt;br /&gt;
Полезно почитать:&lt;br /&gt;
* James MacKinnon, [https://core.ac.uk/download/pdf/6494253.pdf Bootstrap Methods in Econometrics (про дикий и парный бутстрэп)]&lt;br /&gt;
* [https://www.unofficialgoogledatascience.com/2015/08/an-introduction-to-poisson-bootstrap26.html Poisson bootstrap]&lt;br /&gt;
&lt;br /&gt;
Тетрадка с семинара: &lt;br /&gt;
* [https://github.com/xenakas/stat4mr_2021/tree/main/seminar2 bootstrap_part2]&lt;br /&gt;
&lt;br /&gt;
==== Лекция 3. Ещё немного про бутстрэп, тест Уэлча ====&lt;br /&gt;
[https://youtu.be/3S60WStdb_w Запись лекции]&lt;br /&gt;
&lt;br /&gt;
Тетрадка с семинара:&lt;br /&gt;
* [https://github.com/xenakas/stat4mr_2021/tree/main/seminar3_welch welch]&lt;br /&gt;
&lt;br /&gt;
==== Лекция 4. Манн Уитни, CUPED ====&lt;br /&gt;
[https://www.youtube.com/watch?v=oq9YAYzJZbw Запись лекции]&lt;br /&gt;
&lt;br /&gt;
Полезно почитать:&lt;br /&gt;
* Deng, [https://exp-platform.com/Documents/2013-02-CUPED-ImprovingSensitivityOfControlledExperiments.pdf Improving the Sensitivity of Online Experiments]&lt;br /&gt;
* Victor Lei, [https://booking.ai/how-booking-com-increases-the-power-of-online-experiments-with-cuped-995d186fff1d How booking increases power with CUPED]&lt;br /&gt;
&lt;br /&gt;
Тетрадка с семинара:&lt;br /&gt;
* [https://github.com/xenakas/stat4mr_2021/tree/main/seminar4_mann_whitney mann_whitney]&lt;br /&gt;
&lt;br /&gt;
==== Лекция 5. CUPED, DND ====&lt;br /&gt;
[https://youtu.be/saeAPdTTfTM Запись лекции]&lt;br /&gt;
&lt;br /&gt;
Тетрадка с семинара:&lt;br /&gt;
* [https://github.com/xenakas/stat4mr_2021/tree/main/seminar5_cuped cuped]&lt;br /&gt;
&lt;br /&gt;
==== Лекция 6. Мэтчинг ====&lt;br /&gt;
[https://youtu.be/BQt-YZtknG4 Запись лекции]&lt;br /&gt;
&lt;br /&gt;
Тетрадка с семинара:&lt;br /&gt;
* [https://github.com/xenakas/stat4mr_2021/tree/main/seminar6_did matching]&lt;br /&gt;
&lt;br /&gt;
==== Лекция 7. Поправка Бонферрони ====&lt;br /&gt;
[https://youtu.be/NNT4cVwZdmo Запись лекции]&lt;br /&gt;
&lt;br /&gt;
Тетрадка с семинара:&lt;br /&gt;
* [https://github.com/xenakas/stat4mr_2021/tree/main/seminar7_matching_bonferroni matching &amp;amp; bonferroni]&lt;br /&gt;
&lt;br /&gt;
==== Лекция 8. Sampling ====&lt;br /&gt;
[https://youtu.be/ti9Tg8O-dhc Запись лекции]&lt;br /&gt;
&lt;br /&gt;
Тетрадка с семинара:&lt;br /&gt;
* [https://github.com/xenakas/stat4mr_2021/tree/main/seminar8_sampling sampling]&lt;br /&gt;
&lt;br /&gt;
==== Лекция 9. Стратификация, вычисление размера выборки ====&lt;br /&gt;
[https://youtu.be/en93OWTQRnU Запись лекции]&lt;br /&gt;
&lt;br /&gt;
Тетрадка с семинара:&lt;br /&gt;
* [https://github.com/xenakas/stat4mr_2021/tree/main/seminar9_sample_size sample_size]&lt;br /&gt;
&lt;br /&gt;
==== Лекция 10. MDE ====&lt;br /&gt;
[https://youtu.be/sufwhXz-0Co Запись лекции]&lt;br /&gt;
&lt;br /&gt;
[https://www.biostat.wisc.edu/~lindstro/13.sample.size.10.20.pdf Слайды от Mary Lindstrom, Intro to biostat]&lt;br /&gt;
&lt;br /&gt;
==== Лекция 11. Anova - 1 ====&lt;br /&gt;
[https://youtu.be/A_IFVLzqpts Запись лекции]&lt;br /&gt;
&lt;br /&gt;
==== Лекция 12. Anova - 2 ====&lt;br /&gt;
[https://youtu.be/Xh-fyCyQzdw Запись лекции]&lt;br /&gt;
&lt;br /&gt;
==== Лекция 13. Последняя... ====&lt;br /&gt;
[https://youtu.be/8eblxgclX6c Запись лекции]&lt;br /&gt;
&lt;br /&gt;
== Боевой листок: семестр II ==&lt;br /&gt;
&lt;br /&gt;
==== Лекция 1. Таблицы сопряженности ====&lt;br /&gt;
&lt;br /&gt;
* Стандарт: LR тест. &lt;br /&gt;
* Историческая ценность: хи-квадрат критерий Пирсона. &lt;br /&gt;
* Тест на независимость.&lt;br /&gt;
&lt;br /&gt;
==== Лекция 2. Дискриминантный анализ ====&lt;br /&gt;
&lt;br /&gt;
* Дискриминантный анализ — генеративная модель: f(y, x). &lt;br /&gt;
* LDA, QDA, MDA.&lt;br /&gt;
* Выводим границу для LDA.&lt;br /&gt;
* Хорошие слайды Jia Li: [http://personal.psu.edu/jol2/course/stat597e/notes2/lda.pdf lda, qda], [http://personal.psu.edu/jol2/course/stat597e/notes2/mda.pdf mda]&lt;br /&gt;
* LDA для снижения размерности [https://sebastianraschka.com/Articles/2014_python_lda.html lda bit by bit], [https://www.sjsu.edu/faculty/guangliang.chen/Math253S20/lec11lda.pdf Lecture by Chen], [https://sites.stat.washington.edu/wxs/Stat592-w2011/Slides/cancorr-notes.pdf Link to Canonical correlation]&lt;br /&gt;
&lt;br /&gt;
==== Лекция 3. Логит ====&lt;br /&gt;
&lt;br /&gt;
* Логит — дискриминирующая модель: f(y|x). В отличие от дискриминантного анализа :)&lt;br /&gt;
* F&amp;#039; = F(1-F)&lt;br /&gt;
* При кодировке 0/1 сумма прогнозных вероятностей равна количеству 1. &lt;br /&gt;
* Проблема совершенной разделимости.&lt;br /&gt;
&lt;br /&gt;
== Полезные источники в перемешку ==&lt;br /&gt;
&lt;br /&gt;
General AB:&lt;br /&gt;
&lt;br /&gt;
* [https://vkteam.medium.com/practitioners-guide-to-statistical-tests-ed2d580ef04f VK practitioner guide]&lt;br /&gt;
* Deng, [https://alexdeng.github.io/public/files/wsdm2017-rup.pdf Trustworthy analysis of online A/B tests: Pitfalls, challenges and solutions]&lt;br /&gt;
* Deng, [https://alexdeng.github.io/ webpage] &lt;br /&gt;
* Stats SE, [https://stats.stackexchange.com/questions/398436/a-b-testing-ratio-of-sums AB testing for ratio of sums]&lt;br /&gt;
* [https://towardsdatascience.com/a-b-testing-a-complete-guide-to-statistical-testing-e3f1db140499 Guide to AB]. Тесты для таблиц сопряжённости, Welch test, Mann-Whitney.&lt;br /&gt;
&lt;br /&gt;
Bootstrap:&lt;br /&gt;
&lt;br /&gt;
* Tim Hestenberg, [https://arxiv.org/abs/1411.5279 What teachers should know about the bootstrap]. Лучшее первое знакомство с бутстрэпом. Если есть время на один источник по бутстрэпу, то это то, что нужно.&lt;br /&gt;
* [https://people.eecs.berkeley.edu/~jordan/sail/readings/edgeworth.pdf Edgeworth expansion]. Большая книжка с брутальной теорией, преобразованиями Фурье, доказательствами и картинкой с матрёшками.&lt;br /&gt;
* James MacKinnon, [https://core.ac.uk/download/pdf/6494253.pdf Bootstrap Methods in Econometrics (про дикий и парный бутстрэп)]&lt;br /&gt;
* [https://www.unofficialgoogledatascience.com/2015/08/an-introduction-to-poisson-bootstrap26.html Poisson bootstrap]&lt;br /&gt;
* [https://arxiv.org/abs/1304.7406 Evaluation of Bootstrap Methods]&lt;br /&gt;
&lt;br /&gt;
Робастные ошибки в регрессии:&lt;br /&gt;
&lt;br /&gt;
* James Mackinnon, [https://www.researchgate.net/publication/254447243_Thirty_Years_of_Heteroskedasticity-Robust_Inference 30 years of robust inference]&lt;br /&gt;
&lt;br /&gt;
CUPED + CUPAC:&lt;br /&gt;
&lt;br /&gt;
* Deng, [https://exp-platform.com/Documents/2013-02-CUPED-ImprovingSensitivityOfControlledExperiments.pdf Improving the Sensitivity of Online Experiments, CUPED]&lt;br /&gt;
Оригинальная статья, на CUPED можно смотреть как на две подряд применённых регрессии :)&lt;br /&gt;
* Victor Lei, [https://booking.ai/how-booking-com-increases-the-power-of-online-experiments-with-cuped-995d186fff1d How booking increases power with CUPED]&lt;br /&gt;
* [https://www.researchgate.net/publication/345698207_Control_Using_Predictions_as_Covariates_in_Switchback_Experiments CUPAC]&lt;br /&gt;
Де-факто: признак генерируется любым алгоритмом машинного обучения, затем множественная регрессия с кластер-робастными стандартными ошибками.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Linearization + Delta-method:&lt;br /&gt;
&lt;br /&gt;
* [https://dl.acm.org/doi/10.1145/3159652.3159699 Transformation of Ratio Metrics]&lt;br /&gt;
* [https://www.stat.cmu.edu/~hseltman/files/ratio.pdf Approximate E, Var for ratio]&lt;br /&gt;
* Deng, [https://arxiv.org/abs/1803.06336 Applying delta method:] practical guide with novel ideas&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Эффекты воздействия:&lt;br /&gt;
&lt;br /&gt;
* Рубен Ениколопоп, [http://quantile.ru/06/06-RE.pdf Эффекты воздействия]. Мэтчинг, propensity score.&lt;br /&gt;
* Matheus Facure, [https://matheusfacure.github.io/python-causality-handbook/landing-page.html Causal inference for Brave and True]. Инструментальные переменные, мэтчинг, RDD и прочие попытки выяснить причинно-следственные связи на неэкспериментальных данных. С мемасиками и в питоне.&lt;/div&gt;</summary>
		<author><name>imported&gt;Bdemeshev</name></author>
	</entry>
</feed>