drraug: (Default)
Dmitry Savostyanov ([personal profile] drraug) wrote on May 18th, 2022 at 04:13 pm
It depends! )))

На практике бывает что угодно -- и распределение с двумя горбами (бимодальное), и вообще без горбов (экспоненциальное, например), и любой лысый чорт. И это мы пока говорим про одномерные, а ведь и многомерные тоже есть, там такой зверинец!

По сути-то вся многомерная статистика (которую для монетизации стали называть дата-анализом, машинным обучением или скажем artificial intelligence), это попытка угадать функцию распределения по тем данным, которые удалось собрать. А функция распределения это что? -- это в принципе любая функция, которая неотрицательная и интегрируется в единицу. Таких бесконечно много! А классов функций, для которых мы придумали имена -- их конечно много! Ясно же, что просто никак невозможно попасть этими придуманными функциями во всё богатство комбинаций, которая припасла для нас природа.

Нам иногда везёт больше -- скажем в стат-физике мы усредняем по молекулам, их ооочень много, они действительно довольно сильно независимы, и результат может даже вполне точно оказаться гауссианом. А в делах людских мы усредняем по пяти (ну ок, я по пяти, ты по 500) знакомым в своём твиттере, которые оказались там не потому что они очень разные, а как раз потому что они все чем-то похожи. Ну и конечно результат будет гауссианом ну оооочень приблизительно. А чем будет - сказать трудно, не потому что посчитать сложно, а потому что слова для этой функции мы не придумали.
 
( Read comments )
Post a comment in response:
This account has disabled anonymous posting.
If you don't have an account you can create one now.
HTML doesn't work in the subject.
More info about formatting