Подготовка данных

Прочесть данные, выполнить необходимые преобразования (заменить коды пропуска, перекодировать переменные, вычислить интегральные показатели)

После того, как вы загрузите все скрипты с сайта OSF в одном архиве (по какой-то причине загрузка отдельных файлов приводит к потере части их имени), начните с первого под именем 01_Initial Data Cleaning.R.

####################################
# Read data
####################################
rm(list = ls())
library(foreign)

wellbeing <- read.dta("wb_2016.dta",
                      convert.factors = FALSE)
# "wb_2016.dta" is data from the wellbeing supplement downloaded from PSID website
# Must be Stata version 5-12 file

По какой-то странной причине авторы исследования решили работать с файлами данных коммерческого статистического пакета Stata, несмотря на то, что данные оригинального проекта хранятся в простом текстовом файле. Понятное дело, Stata есть далеко не у всех, поэтому на первом этапе нашего квеста придется разобраться с тем, как данные импортируются из текстового файла без разделителей.

Вот так выглядит фрагмент из пяти строк и 54 столбцов файла WB2016.txt:

000000000111111111122222222223333333333444444444455555
123456789012345678901234567890123456789012345678901234
------------------------------------------------------
1 7525 11 351 420162 822111222131112243534111222133121 ...
1 7525 22 331 420161 922212311111111233212112221111111 ...
1 2679 11 311 320162 533324332122333323243444133323222 ...
1 2000 12 601 320161 523242231454235253553296361434242 ...
1   48 11 612 420162 624244333321113233332111322222421 ...
...