Мотивация и цель исследования
Цель исследования -- на основе анализа открытых статистических данных сравнить ситуацию с преступностью в США и России и попытаться понять:- какие преступления количественно преобладают;
- как изменяется преступность по годам;
- каков уровень преступности в удельном выражении (на 1 млн. населения);
- как указанные параметры распределяются территориально -- по штатам США и регионам России.
Источники данных
Для анализа используются только открытые официальные данные:- Количество совершенных преступлений по основным преступлениям (убийство, грабёж, нападение при отягчающих обстоятельствах, изнасилование):
- США:
Для просмотра ссылки необходимо нажать Вход или Регистрация
- Россия: Количество преступлений, зарегистрированных в отчетном периоде:
Для просмотра ссылки необходимо нажать Вход или Регистрация(данные Генпрокураторы РФ)
- США:
- Население по регионам России:
Для просмотра ссылки необходимо нажать Вход или Регистрация(данные Росстата)
Зная, как многие любят поспекулировать на тему надежности исходных данных (если не откапывают изъяны в самом анализе), не грех сразу же расставить точки над "ё".
Все данные были взяты как есть и не подвергались модификации; над ними лишь производятся статистические вычисления. Это вы можете легко проверить, самостоятельно скачав данные по приведенным ссылкам и сравнив их с теми, которые используются мной.🗣 Вы наверняка "подшаманили" данные как вам нужно...
А каким тогда данным следует доверять? "Независимым" расследованиям "честных" СМИ? Или данным ютуберов / тиктокеров / умных инстраграммеров?🗣 Да разве можно доверять нашей статистике? В нашем "THE GULAG" ☭ нарисуют что угодно!
/🗣 Да и ФБР что угодно расскажут, чтобы свой зад прикрыть! Это же ИМПЕРИЯ ЛЖИ!
Поскольку данные по преступлениям в России доступны (в указанном источнике) только с 2008 г., то датасет по США также взят за аналогичный период: с 2008 по 2020 г. включительно.
Для использования в Python данные были предварительно сохранены в CSV файлы.
Все исходные файлы и Jupyter-ноутбук проекта можно скачатьДля просмотра ссылки необходимо нажать Вход или Регистрация.
Используемые инструменты
Я традиционно использую для анализа Python (у меня версия 3.10) с установленными пакетами:- для работы с данными: pandas, numpy
- для создания карт: folium, geopandas, branca
- для графиков: matplotlib, seaborn
Для просмотра ссылки необходимо нажать
Вход или Регистрация
.Всё перечисленное уже идет в комплекте с известными дистрибутивами Python. Я использую
Для просмотра ссылки необходимо нажать
Вход или Регистрация
на Windows-машине.Конечно, вам ничего не мешает проделать то же самое в R, JS, MatLAB или даже Excel. Я выбрал свое Орудие
Подготовка данных
Итак, после загрузки всех необходимых пакетов, импорта и начальной обработки исходных данных (см. код в Jupyter) получаем следующие наборы данных:Количество преступлений в США (первые 10 строк из 676)
year | state_abbr | state_name | population | violent_crime | homicide | robbery | aggravated_assault | property_crime | burglary | larceny | motor_vehicle_theft | rape |
---|---|---|---|---|---|---|---|---|---|---|---|---|
2008 | 0 | 0 | 304059724 | 1394461 | 16465 | 443563 | 843683 | 9774152 | 2228887 | 6586206 | 959059 | 90750 |
2008 | AK | Alaska | 686293 | 4475 | 27 | 645 | 3356 | 20090 | 3237 | 15225 | 1628 | 447 |
2008 | AL | Alabama | 4661900 | 21110 | 351 | 7346 | 11795 | 190416 | 50411 | 126539 | 13466 | 1618 |
2008 | AR | Arkansas | 2855390 | 14649 | 165 | 2777 | 10244 | 110360 | 33912 | 69905 | 6543 | 1463 |
2008 | AZ | Arizona | 6500180 | 31567 | 462 | 9809 | 19096 | 266653 | 58606 | 169460 | 38587 | 2200 |
2008 | CA | California | 36756666 | 185329 | 2142 | 69388 | 104896 | 1080996 | 237811 | 650656 | 192529 | 8903 |
2008 | CO | Colorado | 4939456 | 17480 | 165 | 3404 | 11760 | 139340 | 28054 | 97937 | 13349 | 2151 |
2008 | CT | Connecticut | 3501252 | 10737 | 132 | 4043 | 5882 | 87210 | 15107 | 63212 | 8891 | 680 |
2008 | DC | District of Columbia | 591833 | 8509 | 186 | 4430 | 3707 | 30211 | 3788 | 19958 | 6465 | 186 |
2008 | DE | Delaware | 873092 | 6187 | 57 | 1847 | 3912 | 31385 | 6783 | 22045 | 2557 | 371 |
year | region | aggravated_assault | armed_robbery | extortion | homicide | larceny | misdemeanor | rape | robbery | population |
---|---|---|---|---|---|---|---|---|---|---|
2008 | Алтайский край | 926 | 315 | 110 | 377 | 29218 | 56 | 90 | 4817 | 2446182 |
2008 | Амурская область | 495 | 183 | 64 | 219 | 10085 | 21 | 39 | 1582 | 841579 |
2008 | Архангельская область (без а/о) | 398 | 330 | 91 | 199 | 12486 | 102 | 87 | 1953 | 0 |
2008 | Архангельская область (с а/о) | 422 | 334 | 101 | 216 | 12816 | 122 | 88 | 1998 | 1251684 |
2008 | Астраханская область | 254 | 265 | 68 | 118 | 8486 | 175 | 90 | 1749 | 1007911 |
2008 | Белгородская область | 232 | 121 | 53 | 98 | 6864 | 82 | 33 | 789 | 1523180 |
2008 | Брянская область | 334 | 155 | 29 | 155 | 10997 | 95 | 43 | 1000 | 1298797 |
2008 | Владимирская область | 353 | 373 | 50 | 176 | 14346 | 115 | 28 | 1910 | 1462340 |
2008 | Волгоградская область | 665 | 416 | 89 | 278 | 18657 | 166 | 153 | 3283 | 2620595 |
2008 | Вологодская область | 479 | 345 | 98 | 155 | 12169 | 257 | 43 | 2123 | 1216955 |
- year: год, для которого приведены данные
- state_abbr, state_name (для США) и region (для России): штат или регион
- population: численность населения в указанном регионе в указанный год
- остальные столбцы -- количество соответствующих преступлений
- в исходных датасетах уже есть суммарные показатели для всей страны: в датасете по США они соответствуют строкам, в которых название штата равно нулю, а в датасете по России -- где в столбце region стоит "Российская Федерация";
- столбцы в российском датасете были переименованы из источника в английские наименования преступлений в соответствии со следующей таблицей:
'по ст.111 УК РФ (Умышленное причинение вреда здоровью)': 'aggravated assault',
'по ст.131 УК РФ (Изнасилование)': 'rape',
'по ст.158 УК РФ (Кража)': 'larceny',
'по ст.161 УК РФ (Грабёж)': 'robbery',
'по ст.162 УК РФ (Разбой)': 'armed robbery',
'по ст.163 УК РФ (Вымогательство)': 'extortion',
'по ст.213 УК РФ (Хулиганство)': 'misdemeanor'}
Поскольку у двух полученных наборов данных совпадают только несколько видов преступлений, для исследования мы возьмем только четыре самых "ядреных":
- убийство (homicide)
- нападение [с причинением вреда здоровью] (aggravated assault)
- грабёж (robbery)
- изнасилование (rape)
Годовые показатели по стране
Начнем обзор данных с самого очевидного -- годового количества преступлений в масштабах стран (США и России).США
В абсолютных показателях (количество преступлений в год * 1000) картина в этой стране выглядит следующим образом:С большим отрывом лидирует нападение (по-видимому, без цели ограбления, т.к. ограбление -- это отдельный график). Причем, видно, что после некого спада к 2013 г., количество нападений быстро возрастает. За один только 2020 год рост составил 100 тысяч случаев! Количество грабежей, напротив, падает. Что бы это могло значить? Так и напрашивается вывод о том, что жестокость становится все более бессмысленной. Развлекаются ребята, что тут скажешь ;)
Изнасилования также растут, несмотря на то, что в 2020 г. был небольшой спад. На фоне остальных преступлений убийств кажется мало, и график выглядит плоским; но если приглядеться к цифрам, видно, что и здесь есть рост: после "плато" в 15-17 тыс. убийств за 2008--2019 гг., в 2020 г. их количество резко поднялось до 22 тыс.
Давайте теперь посмотрим на удельные показатели, разделив количество преступлений на численность населения * 1 млн. Это поможет проанализировать "преступные наклонности" нации, так сказать. Имеем:
В принципе, здесь картина та же, почти "пуля в пулю", что говорит нам о независимости преступности в США от численности населения: тенденции будут сохраняться при любой численности. Интересно было бы посмотреть, как они меняются в зависимости от состава населения (по расе, возрасту и т.п.), но это как-нибудь в другой раз.
А пока посмотрим, что там делается на нашем дворе.
Россия
При взгляде на этот график сразу бросается в глаза пикирующий тренд грабежей: их количество с 2008 г. снижается нелинейно, приближаясь к некому плато (на 2020 г. падение еще продолжается). За 13 лет количество грабежей упало в 6.5 раз. За этот же период в США грабежи сократились в 2 раза. По состоянию на 2020 г. в США грабят в 3 раза чаще, чем у нас.
Остальные три вида преступлений также обнаруживают тенденцию к сокращению, хотя спад здесь не такой заметный. Так, количество нападений (с причинением тяжкого вреда здоровью) сократилось в 2 раза с 2008 по 2020 г. Убийства сократились 2.5 раза -- с 40 тыс. в 2008 г. до 15 тыс. в 2020 г. Изнасилования сократились почти в 2 раза -- с 12.5 тыс. в 2008 г. до 7 тыс. в 2020 г.
Одним словом, боремся с
В удельных показателях выглядит так:
Подумать только: в 2008 г. почти каждый шестисотый житель России привлекался за ограбление! В целом, картина здесь аналогичная, что опять говорит о том, что в масштабах страны уровень преступности не зависит от численности населения; здесь необходим учет региональных, социально-экономических, этнических и других внешних факторов.
Сравнение показателей на конец периода (2020 г.)
Давайте теперь сравним показатели преступности по США и России на 2020 г. (конец наблюдаемого периода).При сравнении преступности в США и России можно сделать следующие наблюдения:
- Как в абсолютных величинах, так и при расчете на 1 млн. населения в США преступность выше, чем в России по состоянию на 2020 г.
- В США уровень преступности растет (за исключением грабежей), а в России -- падает.
- В США явным лидером из 4 анализируемых видов преступлений является нападение при отягчающих обстоятельствах (на втором месте -- ограбление, на третьем -- изнасилование, на четвертом -- убийство). В России лидирует ограбление (хотя при продолжающемся стремительном падении ситуация может измениться); далее следуют нападение, убийство и изнасилование. Конечно, у нас нет данных о том, как квалифицируются случаи ограбления с нападением (в российских данных, конечно, есть отдельная статья -- разбой, но таких данных нет по США). Но и без этого напрашивается вывод о том, что в США преобладает бессмысленное / бытовое насилие, в то время как российский условный преступник более конкретно мотивирован (наживой). Нападений при отягчающих обстоятельствах (с нанесением тяжких телесных повреждений) в США совершается в 20 (!) раз чаще, чем в России.
- Если сравнивать количество убийств и изнасилований, то в США изнасилований совершается гораздо больше, чем убийств (и рост заметнее): 126 тыс. изнасилований и 21 тыс. убийств в 2020 г. В России же картина обратная: 7 тыс. изнасилований и 15 тыс. убийств в 2020 г. Здесь, наверное, можно подискутировать на тему того, насколько часто в этих двух странах люди заявляют в полицию о совершенном изнасиловании (видимо, в США все же чаще). Также у нас нет информации о том, как отображаются в статистике случаи изнасилования и убийства, совершенные одним человеком в одном и том же месте и времени... Но результат все равно показателен.
- По убийствам США обгоняют нашу страну только начиная с 2020 г. и с минимальным отрывом. Если взглянуть на данные 2008 -- 2019 гг., картина была обратная: убивали больше в России (как в абсолютном, так и в удельном выражении). Например, при усреднении показателей за весь период (2008--2020 гг.) в США удельное количество убийств составляет 51 на 1 млн. человек, а у нас -- 85 на 1 млн. человек. Вот вам и "окаянные нулевые"...
Преступность по регионам
Теперь же будет интересно посмотреть на эти данные в разрезе географического распределения по регионам каждой страны. Это может многое рассказать о глубинных причинах совершаемых преступлений.США
Рейтинг штатов США по суммарному количеству всех 4 видов преступлений в абсолютном выражении:То, что мы видим на этой диаграмме, подтверждает наблюдения моего
Для просмотра ссылки необходимо нажать
Вход или Регистрация
, которое я позволю себе здесь процитировать:Посмотрим на десятку лидеров по каждому виду преступлений:"Голливудский" штат намного опережает по этой печальной статистике все остальные. Тройка лидеров - южные штаты (Калифорния, Техас и Флорида); именно про эти штаты снято большинство американских фильмов про бандитов.
Везде на пьедестале та же "троица" (хотя по грабежам штат Нью-Йорк вытеснил Флориду на 4-е место). Разница между "суперменом"-Калифорнией и Техасом везде примерно одинаковая, кроме изнасилований: здесь эти два штата соперничают на равных.
Так как без данных по численности населения мы не сможем сделать вывод о том, какие же штаты более безопасные для жизни, посмотрим и на удельные показатели:
"Внезапно" в лидеры выбились малочисленные штаты -- Округ Колумбия (где столица страны Вашингтон), Аляска и не такой уж малонаселенный Нью-Мексико.
Топ по видам преступлений выглядит следующим образом:
Ну и чтобы более наглядно было, отобразим удельные показатели преступности на карте:
Итак, можно сделать следующие наблюдения по США:
- самые преступные штаты с точки зрения количества совершаемых преступлений -- самые густо населенные (кэп здесь!); это Калифорния, Техас, Флорида и Нью-Йорк
- в показателях на душу населения с большим отрывом лидирует Округ Колумбия с г. Вашингтон (столица все-таки)
- по 3 из 4 видов преступлений также лидируют "столичные", хотя по нападениям этот отрыв (от Аляски и Нью-Мексико) не столь заметен
- по убийствам на втором месте неожиданно Луизиана -- штат хлопка, работорговли, джаза, блюза и хм... преступности
ИзДля просмотра ссылки необходимо нажать Вход или Регистрация:
In 2015, Louisiana had a higher murder rate (10.3 per 100,000) than any other state in the country for the 27th straight year. Louisiana is the only state with an annual average murder rate (13.6 per 100,000) at least twice as high as the U.S. annual average (6.6 per 100,000) during that period, according to Bureau of Justice Statistics from FBI Uniform Crime Reports.
Wikipedia contributors. (2022, January 25). Louisiana. In Wikipedia, The Free Encyclopedia. Retrieved 00:26, January 27, 2022, fromДля просмотра ссылки необходимо нажать Вход или Регистрация - по изнасилованиям на душу населения явным "фаворитом" выступает холодная Аляска... греются ребята ;)
Россия
Все регионы России по количеству преступлений (в абсолютном выражении):Вот она -- Москва, жемчужина нашей Родины! Как десяток других областей вместе взятых. Понимаем, что дело здесь, конечно, в численности населения... До удельных показателей дойдем, а пока топ-10 по количеству преступлений:
Москва или Московская область везде на первом месте, как видите. Особенно что касается грабежей. Вот с "серебряным призером" интереснее: по убийствам Свердловская область потеснила даже столицу, по нападениям на пятки Московской области наступают Кузбасс, Иркутская область и Свердловская область, по изнасилованиям Москву догоняет все та же "жемчужина Урала".
Ладно, что там с удельными показателями?
Ну и где бы вы теперь согласились постоять в "ролексе" в подземном переходе около полуночи? Тувинцы зверствуют, поморы из Архангельска тоже не хотят уступать... В Тюменской области процветают ограбления.
На карте России выглядит так:
Некоторые наблюдения по России:
- наибольшее количество преступлений совершается в Москве и Московской области, на втором месте -- Свердловская и Иркутская области
- в удельных показателях тройка лидеров -- Тюменская область, Республика Тыва и Архангельская область; в первых двух превалируют грабежи, в Тыве -- высокая доля нападений и убийств
- наиболее преступными регионами в целом являются Сибирь (Иркутская область, Тыва, Забайкалье, Хабаровский край, Кузбасс, Томская область, Тюменская область), Архангельская область и Пермский край
- наиболее безопасными регионами, согласно официальным данным, является Кавказ (может, просто мало данных?), Центральный и Южный ФО, а также ЯНАО, ХМАО и Камчатка
Для просмотра ссылки необходимо нажать
Вход или Регистрация
). Берегите себя в это непростое время! 🖐
Для просмотра ссылки необходимо нажать
Вход или Регистрация