Каталог товаров
Steam Origin Разное Steam аккаунты Origin аккаунты Xbox аккаунты Базы данных Шаблоны для сайта Прогнозы на спорт Антивирусы WOT аккаунты Uplay аккаунты Warface аккаунтыПринимаем к оплате
Купить Тестовые данные для апробации скоринговых моделей |
---|
Есть в наличии.
Цена:
639.53 руб.
|
В нашем магазине вы сможете купить Тестовые данные для апробации скоринговых моделей дешево и надежно. Оплата онлайн, любым удобным способом.
В архиве содержатся тестовые обезличенные данные, предназначенные для апробации различных скоринговых статистических моделей, а также для проведения исследований по поиску различных статистических закономерностей. Модельные данные (Modeling_Data.txt внутри файла Modeling_Data.zip, находящегося в главном архиве) содержат 50000 записей, поля записи разделены табуляцией. Каждая запись представляет собой обезличенные сведения о 31-м параметре (регрессоре) заёмщика, а также информацию отдал он кредит или нет. Несмотря на то, что данные обезличены, они содержат в себе все закономерности реальной предметной области. Файл, содержащийся в архиве Variables_List.zip, описывает поля модельных данных. |
Доп. информация
|
Все данные в архиве на АНГЛИЙСКОМ языке! Следовательно, для того, чтобы ими пользоваться нужны минимальные его знания (или желание разобраться). Данные предоставлялись в открытом доступе на одном из международных конкурсов по Data Mining-у. Некоторые поля модельных данных: ID_CLIENT - Идентификатор клиента (заёмщика) ID_SHOP - Идентификатор кредитного магазина, где был приобретен кредитный продукт SEX - Пол (М - мужской, F - женский) MARITAL_STATUS - Семейное положение (S - холост/не женат, С - женат/замужем, D - разведен, V - вдовец/вдова, О - другое) AGE - Возраст QUANT_DEPENDANTS - Количество иждивенцев у заёмщика EDUCATION - образовательный уровень (может быть не указан) FLAG_RESIDENCIAL_PHONE - Есть ли постоянный телефонный номер (Y - да, N - нет) AREA_CODE_RESIDENCIAL_PHONE - Измененный код области телефона заёмщика PAYMENT_DAY - Фиксированный день месяца регулярного платежа по погашению кредита SHOP_RANK - Рейтинг компании-продавца кредитного продукта, представленный в финансовых терминах RESIDENCE_TYPE - Тип жилья (Р - собственное, A - арендуемое, С - в доме родителей, O - другое) MONTHS_IN_RESIDENCE - время проживания в текущем месте в месяцах FLAG_MOTHERS_NAME - Указано ли в анкете заёмщика имя матери (Y - да, N - нет) FLAG_FATHERS_NAME - Указано ли в анкете заёмщика имя отца (Y - да, N - нет) и так далее до последнего поля: TARGET_LABEL_BAD - Отдал ли в конце концов заёмщик кредит (1 - НЕ отдал, 0 - отдал) Возможные сферы научно-прикладных исследований, которые могут основываться на этих данных: - СКОРИНГ. - МАТЕМАТИЧЕСКАЯ СТАТИСТИКА (в том числе, неклассические разделы, например, статистика объектов нечисловой природы). - НЕЙРОННЫЕ СЕТИ Кроме того, в архиве есть еще два набора данных (в файлах Prediction_Data.zip и LeaderBoard_Data.zip) по 10000 записей каждый без указания того, отдал заёмщик или нет. Эти датасеты могут быть использованы для проверки созданных Вами статистических моделей. Особую ценность представляет то, что эти два датасета содержат данные за другие промежутки времени (там даже поля не полностью совпадают), что позволит проверить робастность (устойчивость) Вашей скоринговой математической модели к незначительным конъюнктурным социально-экономическим изменениям, происходящим со временем. Это поможет Вам создавать модели, действительно отражающие скрытые пока закономерности предметной области, то есть законы природы. UPD. По этим данным, например, можно установить, что то, что женщины - более добросовестные плательщики не домысел, а статистический факт практически с любой доверительной вероятностью - и с 95%, и с 99%. |
Количество продаж товара - 4
|
Тип товара: Товар: файл (data_for_research_and_building_scoring_models.rar,
2076933 байта)
|
Загружен - 23.07.2010 20:54:37
|
Продавец - SergiusToday
|
Количество положительных отзывов: 1
|
Количество отрицательных отзывов: 0
|