Компания по разработке игр продает дополнения в своих приложениях. Она собрала данные по поведению пользователей в файл combined-data.csv.
userId - код игрока
userSessionId - код сессии игры
teamLevel - уровень команды игроков
platformType - платформа для игры (windows. iphone,…)
count_gameclicks - количество кликов, которые сдела пользователь в игре count_hits - количество очков, которые заработал пользователь count buyId - количество покупок
aуg price - средняя цена покупок
Необходимо построить модель классификации в KNIME, определяющую покупающих игроков и не покупающих и заполнить отчет.
Будем считать, что покупающие игроки, которые покупают в среднем более чем на 5 долларов, а не покупающие, менее или равно 5 долларов. Обучающую выборку разделять в соотношении 60 на 40.
Answers & Comments
Відповідь:
Откройте KNIME и создайте новый рабочий процесс.
1.В узле «Доступ к данным» прочитайте файл combined-data.csv и выберите столбцы «userId», «userSessionId», «teamLevel», «platformType», «count_gameclicks», «count_hits», «count_buyId» и “avg_price”.
2.В узле «Data Manipulation » создайте новый столбец с именем «is_buyer» и установите для него значение 1, если столбец «avg_price» больше 5 долларов, и 0, если он меньше или равен 5 долларам.
3.В узле «Partition» разделите данные на обучающую выборку (60%) и проверочную выборку (40%), используя столбец «is_buyer» в качестве критерия разделения.
4.В узле «Моdeling» выберите алгоритм классификации, такой как логистическая регрессия или деревья решений, и обучите модель с помощью обучающей выборки.
5.В узле «Evalution» оцените производительность модели, используя такие метрики, как точность, точность и полнота.
6.В узле «Reporting» сгенерируйте отчет, обобщающий результаты модели классификации.
Затем вы можете использовать обученную модель, чтобы предсказать, является ли игрок покупающим или непокупающим игроком, предоставив ей данные игрока.
Пояснення:
в теории как-то так :D