December 22nd, 2011

leto

Towards doktorskaya

Ну что, я наконец-то написал работающий скрипт в R. Он делает LDA + size-correction. Вчера опробовал его на данных из своей прошлогодней статьи. За три часа работы он обсчитал примерно 6200 комбинаций признаков (все комбинации из 17 по 5) и получил результат, хотя и сильно отличающийся от того, что в статье, но все же отчасти на него похожий. Каждый анализ прогоняется 100 раз, с разными случайно выбранными обучающими выборками, валидизация - по среднему проценту ошибок классификации в группах (отдельно training и holdout) и по Wilks lambda.

Похоже, что в R мне уже становится удобнее работать, чем в Статистике. Скажем, для size-correction по Мозиманну в Статистике приходится вводить соответствующую формулу в каждой переменной (которых может быть 16-18), тогда как в R это делается сразу для всех нужных переменных с помощью функции apply(). Теперь, наверное, надо будет осваивать PCA и, соответственно, построение графиков...

Collapse )