срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии

Π’Ρ‹Π±ΠΎΡ€ Π»ΡƒΡ‡ΡˆΠ΅Π³ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° машинного обучСния для вашСй Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии

Π”Π°Ρ‚Π° ΠΏΡƒΠ±Π»ΠΈΠΊΠ°Ρ†ΠΈΠΈ Mar 5, 2018

срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π€ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии

ΠŸΡ€ΠΈ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Π΅ ΠΊ Π»ΡŽΠ±ΠΎΠΌΡƒ Ρ‚ΠΈΠΏΡƒ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹ машинного обучСния (ML) сущСствуСт мноТСство Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² Π½Π° Π²Ρ‹Π±ΠΎΡ€. Π’ машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ Π΅ΡΡ‚ΡŒ Ρ‚Π°ΠΊ называСмая Ρ‚Π΅ΠΎΡ€Π΅ΠΌΠ° «НСт бСсплатного ΠΎΠ±Π΅Π΄Π°Β», которая Π² основном ΡƒΡ‚Π²Π΅Ρ€ΠΆΠ΄Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ Π½ΠΈ ΠΎΠ΄ΠΈΠ½ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ML Π½Π΅ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΈΡ‚ для всСх Π·Π°Π΄Π°Ρ‡. ΠŸΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² ML сильно зависит ΠΎΡ‚ Ρ€Π°Π·ΠΌΠ΅Ρ€Π° ΠΈ структуры Π²Π°ΡˆΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ…. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹ΠΉ Π²Ρ‹Π±ΠΎΡ€ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° часто остаСтся нСясным, Ссли Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΌΡ‹ Π½Π΅ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΈΠΌ наши Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ Π½Π°ΠΏΡ€ΡΠΌΡƒΡŽ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ старыС ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΠΏΡ€ΠΎΠ± ΠΈ ошибок.

Но Ρƒ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ML Π΅ΡΡ‚ΡŒ свои ΠΏΠ»ΡŽΡΡ‹ ΠΈ минусы, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π² качСствС руководства. Π₯отя ΠΎΠ΄ΠΈΠ½ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ Π½Π΅ всСгда Π±ΡƒΠ΄Π΅Ρ‚ Π»ΡƒΡ‡ΡˆΠ΅ Π΄Ρ€ΡƒΠ³ΠΎΠ³ΠΎ, Π΅ΡΡ‚ΡŒ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ свойства ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π² качСствС руководства для быстрого Π²Ρ‹Π±ΠΎΡ€Π° ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎΠ³ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΠΈ настройки Π³ΠΈΠΏΠ΅Ρ€ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ². ΠœΡ‹ рассмотрим нСсколько извСстных Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² ML для Π·Π°Π΄Π°Ρ‡ рСгрСссии ΠΈ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΠΌ, ΠΊΠΎΠ³Π΄Π° ΠΈΡ… ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ, исходя ΠΈΠ· ΠΈΡ… ΡΠΈΠ»ΡŒΠ½Ρ‹Ρ… ΠΈ слабых сторон. Π­Ρ‚ΠΎΡ‚ пост Π΄ΠΎΠ»ΠΆΠ΅Π½ ΠΏΠΎΠΌΠΎΡ‡ΡŒ Π²Π°ΠΌ Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ Π»ΡƒΡ‡ΡˆΠΈΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ML для вашСй рСгрСссионной Π·Π°Π΄Π°Ρ‡ΠΈ!

ЛинСйная ΠΈ полиномиальная рСгрСссия

срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π€ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии

БущСствуСт Ρ‚Ρ€Π΅Ρ‚ΠΈΠΉ Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ ΠΎΠ±Ρ‰ΠΈΠΉ случай, Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΡ‹ΠΉ полиномиальной рСгрСссиСй, ΠΊΠΎΠ³Π΄Π° модСль Ρ‚Π΅ΠΏΠ΅Ρ€ΡŒ становится Π½Π΅Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ ΠΊΠΎΠΌΠ±ΠΈΠ½Π°Ρ†ΠΈΠ΅ΠΉ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², Ρ‚. Π•. ΠœΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ ΡΠΊΡΠΏΠΎΠ½Π΅Π½Ρ†ΠΈΠ°Π»ΡŒΠ½Ρ‹Π΅ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Π΅, синус ΠΈ косинус ΠΈ Ρ‚. Π”. Однако для этого трСбуСтся Π·Π½Π°Π½ΠΈΠ΅ Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ Π΄Π°Π½Π½Ρ‹Π΅ связаны с Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹ΠΌΠΈ Π΄Π°Π½Π½Ρ‹ΠΌΠΈ. МодСли рСгрСссии ΠΌΠΎΠ³ΡƒΡ‚ ΠΎΠ±ΡƒΡ‡Π°Ρ‚ΡŒΡΡ с использованиСм стохастичСского Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½ΠΎΠ³ΠΎ спуска (SGD).

ΠŸΠ»ΡŽΡΡ‹:

ΠœΠΈΠ½ΡƒΡΡ‹:

НСйронныС сСти

срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π€ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии

НСйронная ΡΠ΅Ρ‚ΡŒ состоит ΠΈΠ· взаимосвязанной Π³Ρ€ΡƒΠΏΠΏΡ‹ ΡƒΠ·Π»ΠΎΠ², Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΡ‹Ρ… Π½Π΅ΠΉΡ€ΠΎΠ½Π°ΠΌΠΈ. Π’Ρ…ΠΎΠ΄Π½Ρ‹Π΅ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Π΅ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° ΠΈΠ· Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΠ΅Ρ€Π΅Π΄Π°ΡŽΡ‚ΡΡ Π² эти Π½Π΅ΠΉΡ€ΠΎΠ½Ρ‹ Π² Π²ΠΈΠ΄Π΅ многопарамСтричСской Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ ΠΊΠΎΠΌΠ±ΠΈΠ½Π°Ρ†ΠΈΠΈ, Π³Π΄Π΅ значСния, ΡƒΠΌΠ½ΠΎΠΆΠ΅Π½Π½Ρ‹Π΅ Π½Π° ΠΊΠ°ΠΆΠ΄ΡƒΡŽ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½ΡƒΡŽ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°, Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ΡΡ вСсами. Π—Π°Ρ‚Π΅ΠΌ ΠΊ этой Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ ΠΊΠΎΠΌΠ±ΠΈΠ½Π°Ρ†ΠΈΠΈ примСняСтся Π½Π΅Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΡΡ‚ΡŒ, которая Π΄Π°Π΅Ρ‚ Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ слоТныС Π½Π΅Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹Π΅ ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡ. НСйронная ΡΠ΅Ρ‚ΡŒ ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΠΌΠ΅Ρ‚ΡŒ нСсколько слоСв, Π² ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅ ΠΎΠ΄Π½ΠΎΠ³ΠΎ слоя ΠΏΠ΅Ρ€Π΅Π΄Π°ΡŽΡ‚ΡΡ Π½Π° ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΉ Ρ‚Π°ΠΊΠΈΠΌ ΠΆΠ΅ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ. На Π²Ρ‹Ρ…ΠΎΠ΄Π΅, ΠΊΠ°ΠΊ ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ, Π½Π΅ примСняСтся Π½Π΅Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΡΡ‚ΡŒ. НСйронныС сСти ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‚ΡΡ с использованиСм стохастичСского Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½ΠΎΠ³ΠΎ спуска (SGD) ΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΠΎΠ±Ρ€Π°Ρ‚Π½ΠΎΠ³ΠΎ распространСния (ΠΎΠ±Π° ΠΎΡ‚ΠΎΠ±Ρ€Π°ΠΆΠ°ΡŽΡ‚ΡΡ Π² GIF Π²Ρ‹ΡˆΠ΅).

ΠŸΠ»ΡŽΡΡ‹:

ΠœΠΈΠ½ΡƒΡΡ‹:

Π”Π΅Ρ€Π΅Π²ΡŒΡ рСгрСссии ΠΈ случайныС лСса

срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π€ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии

ΠŸΠ»ΡŽΡΡ‹:

ΠœΠΈΠ½ΡƒΡΡ‹:

Π’Ρ‹Π²ΠΎΠ΄

Boom! Π’ΠΎΡ‚ ваши ΠΏΠ»ΡŽΡΡ‹ ΠΈ минусы! Π’ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΌ постС ΠΌΡ‹ рассмотрим ΠΏΠ»ΡŽΡΡ‹ ΠΈ минусы Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ классификации. НадСюсь, Π²Π°ΠΌ понравился этот пост ΠΈ Π²Ρ‹ ΡƒΠ·Π½Π°Π»ΠΈ Ρ‡Ρ‚ΠΎ-Ρ‚ΠΎ Π½ΠΎΠ²ΠΎΠ΅ ΠΈ ΠΏΠΎΠ»Π΅Π·Π½ΠΎΠ΅. Если Π²Ρ‹ сдСлали, Π½Π΅ ΡΡ‚Π΅ΡΠ½ΡΠΉΡ‚Π΅ΡΡŒ Ρ…Π»ΠΎΠΏΠ°Ρ‚ΡŒ Π² ладоши.

Нравится ΡƒΡ‡ΠΈΡ‚ΡŒΡΡ?

Π‘Π»Π΅Π΄ΡƒΠΉ Π·Π° ΠΌΠ½ΠΎΠΉ ΠΏΠΎΡ‰Π΅Π±Π΅Ρ‚Π³Π΄Π΅ я ΠΏΡƒΠ±Π»ΠΈΠΊΡƒΡŽ всС ΠΎ Π½ΠΎΠ²Π΅ΠΉΡˆΠΈΡ… ΠΈ Π»ΡƒΡ‡ΡˆΠΈΡ… ИИ, тСхнологиях ΠΈ Π½Π°ΡƒΠΊΠ΅! Π‘Π²ΡΠ·Π°Ρ‚ΡŒΡΡ со ΠΌΠ½ΠΎΠΉ Π½Π°LinkedInслишком!

Π Π΅ΠΊΠΎΠΌΠ΅Π½Π΄ΡƒΠ΅ΠΌΠΎΠ΅ Ρ‡Ρ‚Π΅Π½ΠΈΠ΅

И просто напослСдок, я ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°ΡŽ этот Π±Π»ΠΎΠ³ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ партнСрских ссылок Amazon Π½Π° Π·Π°ΠΌΠ΅Ρ‡Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ΠΊΠ½ΠΈΠ³ΠΈ, ΠΏΠΎΡ‚ΠΎΠΌΡƒ Ρ‡Ρ‚ΠΎ ΠΎΠ±ΠΌΠ΅Π½ ΠΎΡ‚Π»ΠΈΡ‡Π½Ρ‹ΠΌΠΈ ΠΊΠ½ΠΈΠ³Π°ΠΌΠΈ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ всСм! Как ΠΏΠ°Ρ€Ρ‚Π½Π΅Ρ€ Amazon я Π·Π°Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°ΡŽ Π½Π° ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΡ… ΠΏΠΎΠΊΡƒΠΏΠΊΠ°Ρ….

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

5 Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² рСгрСссии Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ, ΠΎ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π²Π°ΠΌ слСдуСт Π·Π½Π°Ρ‚ΡŒ

срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π€ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии
Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ: Vecteezy

Π”Π°, линСйная рСгрСссия Π½Π΅ СдинствСнная

Π‘Ρ‹ΡΡ‚Ρ€Π΅Π½ΡŒΠΊΠΎ Π½Π°Π·ΠΎΠ²ΠΈΡ‚Π΅ ΠΏΡΡ‚ΡŒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² машинного обучСния.

Вряд Π»ΠΈ Π²Ρ‹ Π½Π°Π·ΠΎΠ²Π΅Ρ‚Π΅ ΠΌΠ½ΠΎΠ³ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² рСгрСссии. Π’ ΠΊΠΎΠ½Ρ†Π΅ ΠΊΠΎΠ½Ρ†ΠΎΠ², СдинствСнным ΡˆΠΈΡ€ΠΎΠΊΠΎ распространСнным Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠΌ рСгрСссии являСтся линСйная рСгрСссия, Π³Π»Π°Π²Π½Ρ‹ΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ ΠΈΠ·-Π·Π° Π΅Π΅ простоты. Однако линСйная рСгрСссия часто Π½Π΅ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΠΌΠ° ΠΊ Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹ΠΌ Π΄Π°Π½Π½Ρ‹ΠΌ ΠΈΠ·-Π·Π° слишком ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Π½Ρ‹Ρ… возмоТностСй ΠΈ ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Π½ΠΎΠΉ свободы ΠΌΠ°Π½Π΅Π²Ρ€Π°. Π•Π΅ часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π² качСствС Π±Π°Π·ΠΎΠ²ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ для ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΈ сравнСния с Π½ΠΎΠ²Ρ‹ΠΌΠΈ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Π°ΠΌΠΈ Π² исслСдованиях.

Команда Mail.ru Cloud Solutions ΠΏΠ΅Ρ€Π΅Π²Π΅Π»Π° ΡΡ‚Π°Ρ‚ΡŒΡŽ, Π°Π²Ρ‚ΠΎΡ€ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ описываСт 5 Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² рСгрСссии. Π˜Ρ… стоит ΠΈΠΌΠ΅Ρ‚ΡŒ Π² своСм Π½Π°Π±ΠΎΡ€Π΅ инструмСнтов наряду с популярными Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°ΠΌΠΈ классификации, Ρ‚Π°ΠΊΠΈΠΌΠΈ ΠΊΠ°ΠΊ SVM, Π΄Π΅Ρ€Π΅Π²ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ ΠΈ Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Π΅ сСти.

1. НСйросСтСвая рСгрСссия

ВСория

НСйронныС сСти нСвСроятно ΠΌΠΎΡ‰Π½Ρ‹Π΅, Π½ΠΎ ΠΈΡ… ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ для классификации. Π‘ΠΈΠ³Π½Π°Π»Ρ‹ проходят Ρ‡Π΅Ρ€Π΅Π· слои Π½Π΅ΠΉΡ€ΠΎΠ½ΠΎΠ² ΠΈ ΠΎΠ±ΠΎΠ±Ρ‰Π°ΡŽΡ‚ΡΡ Π² ΠΎΠ΄ΠΈΠ½ ΠΈΠ· Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… классов. Однако ΠΈΡ… ΠΌΠΎΠΆΠ½ΠΎ ΠΎΡ‡Π΅Π½ΡŒ быстро Π°Π΄Π°ΠΏΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π² рСгрСссионныС ΠΌΠΎΠ΄Π΅Π»ΠΈ, Ссли ΠΈΠ·ΠΌΠ΅Π½ΠΈΡ‚ΡŒ послСднюю Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ.

ΠšΠ°ΠΆΠ΄Ρ‹ΠΉ Π½Π΅ΠΉΡ€ΠΎΠ½ ΠΏΠ΅Ρ€Π΅Π΄Π°Π΅Ρ‚ значСния ΠΈΠ· ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰Π΅ΠΉ связи Ρ‡Π΅Ρ€Π΅Π· Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ, ΡΠ»ΡƒΠΆΠ°Ρ‰ΡƒΡŽ Ρ†Π΅Π»ΠΈ обобщСния ΠΈ нСлинСйности. ΠžΠ±Ρ‹Ρ‡Π½ΠΎ активационная функция β€” это Ρ‡Ρ‚ΠΎ-Ρ‚ΠΎ Π²Ρ€ΠΎΠ΄Π΅ сигмоиды ΠΈΠ»ΠΈ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ReLU (выпрямлСнный Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹ΠΉ Π±Π»ΠΎΠΊ).

срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π€ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии
Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ. Π‘Π²ΠΎΠ±ΠΎΠ΄Π½ΠΎΠ΅ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅

Но, Π·Π°ΠΌΠ΅Π½ΠΈΠ² послСднюю Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ (Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠΉ Π½Π΅ΠΉΡ€ΠΎΠ½) Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ, Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠΉ сигнал ΠΌΠΎΠΆΠ½ΠΎ ΠΎΡ‚ΠΎΠ±Ρ€Π°Π·ΠΈΡ‚ΡŒ Π½Π° мноТСство Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ, выходящих Π·Π° ΠΏΡ€Π΅Π΄Π΅Π»Ρ‹ фиксированных классов. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Π½Π° Π²Ρ‹Ρ…ΠΎΠ΄Π΅ Π±ΡƒΠ΄Π΅Ρ‚ Π½Π΅ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ отнСсСния Π²Ρ…ΠΎΠ΄Π½ΠΎΠ³ΠΎ сигнала ΠΊ ΠΊΠ°ΠΊΠΎΠΌΡƒ-Π»ΠΈΠ±ΠΎ ΠΎΠ΄Π½ΠΎΠΌΡƒ классу, Π° Π½Π΅ΠΏΡ€Π΅Ρ€Ρ‹Π²Π½ΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅, Π½Π° ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ фиксируСт свои наблюдСния нСйронная ΡΠ΅Ρ‚ΡŒ. Π’ этом смыслС ΠΌΠΎΠΆΠ½ΠΎ ΡΠΊΠ°Π·Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ нСйронная ΡΠ΅Ρ‚ΡŒ ΠΊΠ°ΠΊ Π±Ρ‹ дополняСт Π»ΠΈΠ½Π΅ΠΉΠ½ΡƒΡŽ Ρ€Π΅Π³Ρ€Π΅ΡΡΠΈΡŽ.

НСйросСтСвая рСгрСссия ΠΈΠΌΠ΅Π΅Ρ‚ прСимущСство нСлинСйности (Π² Π΄ΠΎΠΏΠΎΠ»Π½Π΅Π½ΠΈΠ΅ ΠΊ слоТности), ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ ΠΌΠΎΠΆΠ½ΠΎ ввСсти с сигмоидной ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠΌΠΈ Π½Π΅Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹ΠΌΠΈ функциями Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ Ρ€Π°Π½Π΅Π΅ Π² Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти. Однако Ρ‡Ρ€Π΅Π·ΠΌΠ΅Ρ€Π½ΠΎΠ΅ использованиС ReLU Π² качСствС Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ ΠΌΠΎΠΆΠ΅Ρ‚ ΠΎΠ·Π½Π°Ρ‡Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ модСль ΠΈΠΌΠ΅Π΅Ρ‚ Ρ‚Π΅Π½Π΄Π΅Π½Ρ†ΠΈΡŽ ΠΈΠ·Π±Π΅Π³Π°Ρ‚ΡŒ Π²Ρ‹Π²ΠΎΠ΄Π° ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ ReLU ΠΈΠ³Π½ΠΎΡ€ΠΈΡ€ΡƒΠ΅Ρ‚ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ различия ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ значСниями.

Π­Ρ‚ΠΎ ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π΅ΡˆΠΈΡ‚ΡŒ Π»ΠΈΠ±ΠΎ ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΠ΅ΠΌ использования ReLU ΠΈ Π΄ΠΎΠ±Π°Π²Π»Π΅Π½ΠΈΠ΅ΠΌ большСго количСства ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΡ… Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ, Π»ΠΈΠ±ΠΎ Π½ΠΎΡ€ΠΌΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠ΅ΠΉ Π΄Π°Π½Π½Ρ‹Ρ… Π΄ΠΎ строго ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ Π΄ΠΈΠ°ΠΏΠ°Π·ΠΎΠ½Π° ΠΏΠ΅Ρ€Π΅Π΄ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ΠΌ.

РСализация

Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ Keras, построим структуру искусствСнной Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти, хотя Ρ‚ΠΎ ΠΆΠ΅ самоС ΠΌΠΎΠΆΠ½ΠΎ Π±Ρ‹Π»ΠΎ Π±Ρ‹ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ со свСрточной Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ ΡΠ΅Ρ‚ΡŒΡŽ ΠΈΠ»ΠΈ Π΄Ρ€ΡƒΠ³ΠΎΠΉ ΡΠ΅Ρ‚ΡŒΡŽ, Ссли послСдний слой являСтся Π»ΠΈΠ±ΠΎ ΠΏΠ»ΠΎΡ‚Π½Ρ‹ΠΌ слоСм с Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠ΅ΠΉ, Π»ΠΈΠ±ΠΎ просто слоСм с Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠ΅ΠΉ. (ΠžΠ±Ρ€Π°Ρ‚ΠΈΡ‚Π΅ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅, Ρ‡Ρ‚ΠΎ ΠΈΠΌΠΏΠΎΡ€Ρ‚Ρ‹ Keras Π½Π΅ ΡƒΠΊΠ°Π·Π°Π½Ρ‹ для экономии мСста).

model = Sequential()
model.add(Dense(100, input_dim=3, activation=’sigmoid’))
model.add(ReLU(alpha=1.0))
model.add(Dense(50, activation=’sigmoid’))
model.add(ReLU(alpha=1.0))
model.add(Dense(25, activation=’softmax’))

#IMPORTANT PART
model.add(Dense(1, activation=’linear’))

ΠŸΡ€ΠΎΠ±Π»Π΅ΠΌΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Ρ… сСтСй всСгда Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π»Π°ΡΡŒ Π² ΠΈΡ… высокой диспСрсии ΠΈ склонности ΠΊ ΠΏΠ΅Ρ€Π΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΡŽ. Π’ ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½Π½ΠΎΠΌ Π²Ρ‹ΡˆΠ΅ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅ ΠΊΠΎΠ΄Π° ΠΌΠ½ΠΎΠ³ΠΎ источников нСлинСйности, Ρ‚Π°ΠΊΠΈΡ… ΠΊΠ°ΠΊ SoftMax ΠΈΠ»ΠΈ sigmoid.

Если ваша нСйронная ΡΠ΅Ρ‚ΡŒ Ρ…ΠΎΡ€ΠΎΡˆΠΎ справляСтся с ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠΌΠΈ Π΄Π°Π½Π½Ρ‹ΠΌΠΈ с чисто Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ структурой, Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ, Π»ΡƒΡ‡ΡˆΠ΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Ρ€Π΅Π³Ρ€Π΅ΡΡΠΈΡŽ с усСчСнным Π΄Π΅Ρ€Π΅Π²ΠΎΠΌ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ, которая эмулируСт Π»ΠΈΠ½Π΅ΠΉΠ½ΡƒΡŽ ΠΈ Π²Ρ‹ΡΠΎΠΊΠΎΠ΄ΠΈΡΠΏΠ΅Ρ€ΡΠ½ΡƒΡŽ Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΡƒΡŽ ΡΠ΅Ρ‚ΡŒ, Π½ΠΎ позволяСт Π΄Π°Ρ‚Π°-сайСнтисту Π»ΡƒΡ‡ΡˆΠ΅ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π³Π»ΡƒΠ±ΠΈΠ½Ρƒ, ΡˆΠΈΡ€ΠΈΠ½Ρƒ ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚Ρ‹ для контроля пСрСобучСния.

2. РСгрСссия Π΄Π΅Ρ€Π΅Π²Π° Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ

ВСория

Π”Π΅Ρ€Π΅Π²ΡŒΡ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ Π² классификации ΠΈ рСгрСссии ΠΎΡ‡Π΅Π½ΡŒ ΠΏΠΎΡ…ΠΎΠΆΠΈ, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‚ ΠΏΡƒΡ‚Π΅ΠΌ построСния Π΄Π΅Ρ€Π΅Π²ΡŒΠ΅Π² с ΡƒΠ·Π»Π°ΠΌΠΈ Β«Π΄Π°/Π½Π΅Ρ‚Β». Однако Π² Ρ‚ΠΎ врСмя ΠΊΠ°ΠΊ ΠΊΠΎΠ½Π΅Ρ‡Π½Ρ‹Π΅ ΡƒΠ·Π»Ρ‹ классификации приводят ΠΊ ΠΎΠ΄Π½ΠΎΠΌΡƒ Π·Π½Π°Ρ‡Π΅Π½ΠΈΡŽ класса (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, 1 ΠΈΠ»ΠΈ 0 для Π·Π°Π΄Π°Ρ‡ΠΈ Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ классификации), Π΄Π΅Ρ€Π΅Π²ΡŒΡ рСгрСссии Π·Π°ΠΊΠ°Π½Ρ‡ΠΈΠ²Π°ΡŽΡ‚ΡΡ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ΠΌ Π² Π½Π΅ΠΏΡ€Π΅Ρ€Ρ‹Π²Π½ΠΎΠΌ Ρ€Π΅ΠΆΠΈΠΌΠ΅ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, 4593,49 ΠΈΠ»ΠΈ 10,98).

срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π€ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии
Π˜Π»Π»ΡŽΡΡ‚Ρ€Π°Ρ†ΠΈΡ Π°Π²Ρ‚ΠΎΡ€Π°

Из-Π·Π° спСцифичСской ΠΈ высокодиспСрсной ΠΏΡ€ΠΈΡ€ΠΎΠ΄Ρ‹ рСгрСссии просто ΠΊΠ°ΠΊ Π·Π°Π΄Π°Ρ‡ΠΈ машинного обучСния, рСгрСссоры Π΄Π΅Ρ€Π΅Π²Π° Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ слСдуСт Ρ‚Ρ‰Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ ΠΎΠ±Ρ€Π΅Π·Π°Ρ‚ΡŒ. Π’Π΅ΠΌ Π½Π΅ ΠΌΠ΅Π½Π΅Π΅, ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ ΠΊ рСгрСссии нСрСгулярСн β€” вмСсто Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π²Ρ‹Ρ‡ΠΈΡΠ»ΡΡ‚ΡŒ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Π² Π½Π΅ΠΏΡ€Π΅Ρ€Ρ‹Π²Π½ΠΎΠΌ ΠΌΠ°ΡΡˆΡ‚Π°Π±Π΅, ΠΎΠ½ ΠΏΡ€ΠΈΡ…ΠΎΠ΄ΠΈΡ‚ ΠΊ Π·Π°Π΄Π°Π½Π½Ρ‹ΠΌ ΠΊΠΎΠ½Π΅Ρ‡Π½Ρ‹ΠΌ ΡƒΠ·Π»Π°ΠΌ. Если рСгрСссор ΠΎΠ±Ρ€Π΅Π·Π°Π½ слишком сильно, Ρƒ Π½Π΅Π³ΠΎ слишком ΠΌΠ°Π»ΠΎ ΠΊΠΎΠ½Π΅Ρ‡Π½Ρ‹Ρ… ΡƒΠ·Π»ΠΎΠ², Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π΄ΠΎΠ»ΠΆΠ½Ρ‹ΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ Π²Ρ‹ΠΏΠΎΠ»Π½ΠΈΡ‚ΡŒ свою Π·Π°Π΄Π°Ρ‡Ρƒ.

Π‘Π»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, Π΄Π΅Ρ€Π΅Π²ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ Π΄ΠΎΠ»ΠΆΠ½ΠΎ Π±Ρ‹Ρ‚ΡŒ ΠΎΠ±Ρ€Π΅Π·Π°Π½ΠΎ Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ½ΠΎ ΠΈΠΌΠ΅Π»ΠΎ Π½Π°ΠΈΠ±ΠΎΠ»ΡŒΡˆΡƒΡŽ свободу (Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Π΅ Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Π΅ значСния рСгрСссии β€” количСство ΠΊΠΎΠ½Π΅Ρ‡Π½Ρ‹Ρ… ΡƒΠ·Π»ΠΎΠ²), Π½ΠΎ нСдостаточно, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ½ΠΎ Π±Ρ‹Π»ΠΎ слишком Π³Π»ΡƒΠ±ΠΎΠΊΠΈΠΌ. Если Π΅Π³ΠΎ Π½Π΅ ΠΎΠ±Ρ€Π΅Π·Π°Ρ‚ΡŒ, Ρ‚ΠΎ ΠΈ Π±Π΅Π· Ρ‚ΠΎΠ³ΠΎ высокодиспСрсный Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ станСт Ρ‡Ρ€Π΅Π·ΠΌΠ΅Ρ€Π½ΠΎ слоТным ΠΈΠ·-Π·Π° ΠΏΡ€ΠΈΡ€ΠΎΠ΄Ρ‹ рСгрСссии.

РСализация

РСгрСссия Π΄Π΅Ρ€Π΅Π²Π° Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Π»Π΅Π³ΠΊΠΎ создана Π² sklearn :

Бонус: Π±Π»ΠΈΠ·ΠΊΠΈΠΉ родствСнник Π΄Π΅Ρ€Π΅Π²Π° Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ, Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ random forest (Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ случайного лСса), Ρ‚Π°ΠΊΠΆΠ΅ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Ρ€Π΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Π½ Π² качСствС рСгрСссора. РСгрСссор случайного лСса ΠΌΠΎΠΆΠ΅Ρ‚ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ Π»ΡƒΡ‡ΡˆΠ΅ ΠΈΠ»ΠΈ Π½Π΅ Π»ΡƒΡ‡ΡˆΠ΅, Ρ‡Π΅ΠΌ Π΄Π΅Ρ€Π΅Π²ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ Π² рСгрСссии (Π² Ρ‚ΠΎ врСмя ΠΊΠ°ΠΊ ΠΎΠ½ ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π»ΡƒΡ‡ΡˆΠ΅ Π² классификации) ΠΈΠ·-Π·Π° Ρ‚ΠΎΠ½ΠΊΠΎΠ³ΠΎ баланса ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΈΠ·Π±Ρ‹Ρ‚ΠΎΡ‡Π½Ρ‹ΠΌ ΠΈ нСдостаточным Π² ΠΏΡ€ΠΈΡ€ΠΎΠ΄Π΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² построСния Π΄Π΅Ρ€Π΅Π²Π°.

3. РСгрСссия LASSO

ΠœΠ΅Ρ‚ΠΎΠ΄ рСгрСссии лассо (LASSO, Least Absolute Shrinkage and Selection Operator) β€” это вариация Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ рСгрСссии, ΡΠΏΠ΅Ρ†ΠΈΠ°Π»ΡŒΠ½ΠΎ адаптированная для Π΄Π°Π½Π½Ρ‹Ρ…, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π΄Π΅ΠΌΠΎΠ½ΡΡ‚Ρ€ΠΈΡ€ΡƒΡŽΡ‚ ΡΠΈΠ»ΡŒΠ½ΡƒΡŽ ΠΌΡƒΠ»ΡŒΡ‚ΠΈΠΊΠΎΠ»Π»ΠΈΠ½Π΅Π°Ρ€Π½ΠΎΡΡ‚ΡŒ (Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ ΡΠΈΠ»ΡŒΠ½ΡƒΡŽ ΠΊΠΎΡ€Ρ€Π΅Π»ΡΡ†ΠΈΡŽ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² Π΄Ρ€ΡƒΠ³ с Π΄Ρ€ΡƒΠ³ΠΎΠΌ).

Она Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΠ·ΠΈΡ€ΡƒΠ΅Ρ‚ части Π²Ρ‹Π±ΠΎΡ€Π° ΠΌΠΎΠ΄Π΅Π»ΠΈ, Ρ‚Π°ΠΊΠΈΠ΅ ΠΊΠ°ΠΊ Π²Ρ‹Π±ΠΎΡ€ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ… ΠΈΠ»ΠΈ ΠΈΡΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ². LASSO ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ сТатиС коэффициСнтов (shrinkage), Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ процСсс, Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ значСния Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΡ€ΠΈΠ±Π»ΠΈΠΆΠ°ΡŽΡ‚ΡΡ ΠΊ Ρ†Π΅Π½Ρ‚Ρ€Π°Π»ΡŒΠ½ΠΎΠΉ Ρ‚ΠΎΡ‡ΠΊΠ΅ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€ срСднСму Π·Π½Π°Ρ‡Π΅Π½ΠΈΡŽ).

срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π€ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии
Π˜Π»Π»ΡŽΡΡ‚Ρ€Π°Ρ†ΠΈΡ Π°Π²Ρ‚ΠΎΡ€Π°. УпрощСнная визуализация процСсса сТатия

ΠŸΡ€ΠΎΡ†Π΅ΡΡ сТатия добавляСт рСгрСссионным модСлям нСсколько прСимущСств:

РСгрСссия лассо ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ Ρ€Π΅Π³ΡƒΠ»ΡΡ€ΠΈΠ·Π°Ρ†ΠΈΡŽ L1, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ Π²Π·Π²Π΅ΡˆΠΈΠ²Π°Π΅Ρ‚ ошибки ΠΏΠΎ ΠΈΡ… Π°Π±ΡΠΎΠ»ΡŽΡ‚Π½ΠΎΠΌΡƒ Π·Π½Π°Ρ‡Π΅Π½ΠΈΡŽ. ВмСсто, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, рСгуляризации L2, которая Π²Π·Π²Π΅ΡˆΠΈΠ²Π°Π΅Ρ‚ ошибки ΠΏΠΎ ΠΈΡ… ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚Ρƒ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ сильнСС Π½Π°ΠΊΠ°Π·Ρ‹Π²Π°Ρ‚ΡŒ Π·Π° Π±ΠΎΠ»Π΅Π΅ Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ошибки.

Вакая рСгуляризация часто ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΡ‚ ΠΊ Π±ΠΎΠ»Π΅Π΅ Ρ€Π°Π·Ρ€Π΅ΠΆΠ΅Π½Π½Ρ‹ΠΌ модСлям с мСньшим количСством коэффициСнтов, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ коэффициСнты ΠΌΠΎΠ³ΡƒΡ‚ ΡΡ‚Π°Ρ‚ΡŒ Π½ΡƒΠ»Π΅Π²Ρ‹ΠΌΠΈ ΠΈ, ΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, Π±ΡƒΠ΄ΡƒΡ‚ ΠΈΡΠΊΠ»ΡŽΡ‡Π΅Π½Ρ‹ ΠΈΠ· ΠΌΠΎΠ΄Π΅Π»ΠΈ. Π­Ρ‚ΠΎ позволяСт Π΅Π΅ ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ.

РСализация

Π’ sklearn рСгрСссия лассо поставляСтся с модСлью пСрСкрСстной ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ, которая Π²Ρ‹Π±ΠΈΡ€Π°Π΅Ρ‚ Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ эффСктивныС ΠΈΠ· ΠΌΠ½ΠΎΠ³ΠΈΡ… ΠΎΠ±ΡƒΡ‡Π΅Π½Π½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ с Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹ΠΌΠΈ Ρ„ΡƒΠ½Π΄Π°ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½Ρ‹ΠΌΠΈ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π°ΠΌΠΈ ΠΈ путями обучСния, Ρ‡Ρ‚ΠΎ Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΠ·ΠΈΡ€ΡƒΠ΅Ρ‚ Π·Π°Π΄Π°Ρ‡Ρƒ, ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ ΠΈΠ½Π°Ρ‡Π΅ ΠΏΡ€ΠΈΡˆΠ»ΠΎΡΡŒ Π±Ρ‹ Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡ‚ΡŒ Π²Ρ€ΡƒΡ‡Π½ΡƒΡŽ.

4. ГрСбнСвая рСгрСссия (Ρ€ΠΈΠ΄ΠΆ-рСгрСссия)

ВСория

ГрСбнСвая рСгрСссия ΠΈΠ»ΠΈ Ρ€ΠΈΠ΄ΠΆ-рСгрСссия ΠΎΡ‡Π΅Π½ΡŒ ΠΏΠΎΡ…ΠΎΠΆΠ° Π½Π° Ρ€Π΅Π³Ρ€Π΅ΡΡΠΈΡŽ LASSO Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΠΎΠ½Π° примСняСт сТатиС. Оба Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Ρ…ΠΎΡ€ΠΎΡˆΠΎ подходят для Π½Π°Π±ΠΎΡ€ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ… с большим количСством ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π½Π΅ ΡΠ²Π»ΡΡŽΡ‚ΡΡ нСзависимыми Π΄Ρ€ΡƒΠ³ ΠΎΡ‚ Π΄Ρ€ΡƒΠ³Π° (ΠΊΠΎΠ»Π»ΠΈΠ½Π΅Π°Ρ€Π½ΠΎΡΡ‚ΡŒ).

Однако самоС большоС Ρ€Π°Π·Π»ΠΈΡ‡ΠΈΠ΅ ΠΌΠ΅ΠΆΠ΄Ρƒ Π½ΠΈΠΌΠΈ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ грСбнСвая рСгрСссия ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ Ρ€Π΅Π³ΡƒΠ»ΡΡ€ΠΈΠ·Π°Ρ†ΠΈΡŽ L2, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ Π½ΠΈ ΠΎΠ΄ΠΈΠ½ ΠΈΠ· коэффициСнтов Π½Π΅ становится Π½ΡƒΠ»Π΅Π²Ρ‹ΠΌ, ΠΊΠ°ΠΊ это происходит Π² рСгрСссии LASSO. ВмСсто этого коэффициСнты всё большС ΠΏΡ€ΠΈΠ±Π»ΠΈΠΆΠ°ΡŽΡ‚ΡΡ ΠΊ Π½ΡƒΠ»ΡŽ, Π½ΠΎ Π½Π΅ ΠΈΠΌΠ΅ΡŽΡ‚ большого стимула Π΄ΠΎΡΡ‚ΠΈΡ‡ΡŒ Π΅Π³ΠΎ ΠΈΠ·-Π·Π° ΠΏΡ€ΠΈΡ€ΠΎΠ΄Ρ‹ рСгуляризации L2.

срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π€ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии
Π‘Ρ€Π°Π²Π½Π΅Π½ΠΈΠ΅ ошибок Π² рСгрСссии лассо (слСва) ΠΈ Π³Ρ€Π΅Π±Π½Π΅Π²ΠΎΠΉ рСгрСссии (справа). ΠŸΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ грСбнСвая рСгрСссия ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ Ρ€Π΅Π³ΡƒΠ»ΡΡ€ΠΈΠ·Π°Ρ†ΠΈΡŽ L2, Π΅Π΅ ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ Π½Π°ΠΏΠΎΠΌΠΈΠ½Π°Π΅Ρ‚ ΠΊΡ€ΡƒΠ³, Ρ‚ΠΎΠ³Π΄Π° ΠΊΠ°ΠΊ рСгуляризация лассо L1 рисуСт прямыС Π»ΠΈΠ½ΠΈΠΈ. Π‘Π²ΠΎΠ±ΠΎΠ΄Π½ΠΎΠ΅ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅. Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Π’ лассо ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΠ΅ ΠΎΡ‚ ошибки 5 Π΄ΠΎ ошибки 4 Π²Π·Π²Π΅ΡˆΠΈΠ²Π°Π΅Ρ‚ΡΡ Ρ‚Π°ΠΊ ΠΆΠ΅, ΠΊΠ°ΠΊ ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΠ΅ ΠΎΡ‚ 4 Π΄ΠΎ 3, Π° Ρ‚Π°ΠΊΠΆΠ΅ ΠΎΡ‚ 3 Π΄ΠΎ 2, ΠΎΡ‚ 2 Π΄ΠΎ 1 ΠΈ ΠΎΡ‚ 1 Π΄ΠΎ 0. Π‘Π»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, большС коэффициСнтов достигаСт нуля ΠΈ устраняСтся большС ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ².

Однако Π² Π³Ρ€Π΅Π±Π½Π΅Π²ΠΎΠΉ рСгрСссии ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΠ΅ ΠΎΡ‚ ошибки 5 Π΄ΠΎ ошибки 4 вычисляСтся ΠΊΠ°ΠΊ 5Β² βˆ’ 4Β² = 9, Ρ‚ΠΎΠ³Π΄Π° ΠΊΠ°ΠΊ ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΠ΅ ΠΎΡ‚ 4 Π΄ΠΎ 3 Π²Π·Π²Π΅ΡˆΠΈΠ²Π°Π΅Ρ‚ΡΡ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΊΠ°ΠΊ 7. ΠŸΠΎΡΡ‚Π΅ΠΏΠ΅Π½Π½ΠΎ Π²ΠΎΠ·Π½Π°Π³Ρ€Π°ΠΆΠ΄Π΅Π½ΠΈΠ΅ Π·Π° ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΠ΅ ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Π΅Ρ‚ΡΡ; ΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, устраняСтся мСньшС ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ².

ГрСбнСвая рСгрСссия Π»ΡƒΡ‡ΡˆΠ΅ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΈΡ‚ Π² ситуации, ΠΊΠΎΠ³Π΄Π° ΠΌΡ‹ Ρ…ΠΎΡ‚ΠΈΠΌ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ ΠΏΡ€ΠΈΠΎΡ€ΠΈΡ‚Π΅Ρ‚Π½Ρ‹ΠΌΠΈ большоС количСство ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ…, каТдая ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΈΠΌΠ΅Π΅Ρ‚ нСбольшой эффСкт. Если Π² ΠΌΠΎΠ΄Π΅Π»ΠΈ трСбуСтся ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°Ρ‚ΡŒ нСсколько ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ…, каТдая ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΈΠΌΠ΅Π΅Ρ‚ срСдний ΠΈΠ»ΠΈ большой эффСкт, Π»ΡƒΡ‡ΡˆΠΈΠΌ Π²Ρ‹Π±ΠΎΡ€ΠΎΠΌ Π±ΡƒΠ΄Π΅Ρ‚ лассо.

РСализация

Π“Ρ€Π΅Π±Π½Π΅Π²ΡƒΡŽ Ρ€Π΅Π³Ρ€Π΅ΡΡΠΈΡŽ Π² sklearn ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ (см. Π½ΠΈΠΆΠ΅). Как ΠΈ для рСгрСссии лассо, Π² sklearn Π΅ΡΡ‚ΡŒ рСализация для пСрСкрСстной ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ Π²Ρ‹Π±ΠΎΡ€Π° Π»ΡƒΡ‡ΡˆΠΈΡ… ΠΈΠ· ΠΌΠ½ΠΎΠ³ΠΈΡ… ΠΎΠ±ΡƒΡ‡Π΅Π½Π½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ.

5. РСгрСссия ElasticNet

ВСория

ElasticNet стрСмится ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΠΈΡ‚ΡŒ Π»ΡƒΡ‡ΡˆΠ΅Π΅ ΠΈΠ· Π³Ρ€Π΅Π±Π½Π΅Π²ΠΎΠΉ рСгрСссии ΠΈ рСгрСссии лассо, комбинируя Ρ€Π΅Π³ΡƒΠ»ΡΡ€ΠΈΠ·Π°Ρ†ΠΈΡŽ L1 ΠΈ L2.

Лассо ΠΈ грСбнСвая рСгрСссия ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΡŽΡ‚ собой Π΄Π²Π° Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… ΠΌΠ΅Ρ‚ΠΎΠ΄Π° рСгуляризации. Π’ ΠΎΠ±ΠΎΠΈΡ… случаях Ξ» β€” это ΠΊΠ»ΡŽΡ‡Π΅Π²ΠΎΠΉ Ρ„Π°ΠΊΡ‚ΠΎΡ€, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΠΈΡ€ΡƒΠ΅Ρ‚ Ρ€Π°Π·ΠΌΠ΅Ρ€ ΡˆΡ‚Ρ€Π°Ρ„Π°:

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

5 Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² рСгрСссии Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ, ΠΎ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π²Π°ΠΌ слСдуСт Π·Π½Π°Ρ‚ΡŒ

срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π€ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии
Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ: Vecteezy

Π”Π°, линСйная рСгрСссия Π½Π΅ СдинствСнная

Π‘Ρ‹ΡΡ‚Ρ€Π΅Π½ΡŒΠΊΠΎ Π½Π°Π·ΠΎΠ²ΠΈΡ‚Π΅ ΠΏΡΡ‚ΡŒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² машинного обучСния.

Вряд Π»ΠΈ Π²Ρ‹ Π½Π°Π·ΠΎΠ²Π΅Ρ‚Π΅ ΠΌΠ½ΠΎΠ³ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² рСгрСссии. Π’ ΠΊΠΎΠ½Ρ†Π΅ ΠΊΠΎΠ½Ρ†ΠΎΠ², СдинствСнным ΡˆΠΈΡ€ΠΎΠΊΠΎ распространСнным Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠΌ рСгрСссии являСтся линСйная рСгрСссия, Π³Π»Π°Π²Π½Ρ‹ΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ ΠΈΠ·-Π·Π° Π΅Π΅ простоты. Однако линСйная рСгрСссия часто Π½Π΅ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΠΌΠ° ΠΊ Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹ΠΌ Π΄Π°Π½Π½Ρ‹ΠΌ ΠΈΠ·-Π·Π° слишком ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Π½Ρ‹Ρ… возмоТностСй ΠΈ ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Π½ΠΎΠΉ свободы ΠΌΠ°Π½Π΅Π²Ρ€Π°. Π•Π΅ часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π² качСствС Π±Π°Π·ΠΎΠ²ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ для ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΈ сравнСния с Π½ΠΎΠ²Ρ‹ΠΌΠΈ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Π°ΠΌΠΈ Π² исслСдованиях.

Команда Mail.ru Cloud Solutions ΠΏΠ΅Ρ€Π΅Π²Π΅Π»Π° ΡΡ‚Π°Ρ‚ΡŒΡŽ, Π°Π²Ρ‚ΠΎΡ€ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ описываСт 5 Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² рСгрСссии. Π˜Ρ… стоит ΠΈΠΌΠ΅Ρ‚ΡŒ Π² своСм Π½Π°Π±ΠΎΡ€Π΅ инструмСнтов наряду с популярными Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°ΠΌΠΈ классификации, Ρ‚Π°ΠΊΠΈΠΌΠΈ ΠΊΠ°ΠΊ SVM, Π΄Π΅Ρ€Π΅Π²ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ ΠΈ Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Π΅ сСти.

1. НСйросСтСвая рСгрСссия

ВСория

НСйронныС сСти нСвСроятно ΠΌΠΎΡ‰Π½Ρ‹Π΅, Π½ΠΎ ΠΈΡ… ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ для классификации. Π‘ΠΈΠ³Π½Π°Π»Ρ‹ проходят Ρ‡Π΅Ρ€Π΅Π· слои Π½Π΅ΠΉΡ€ΠΎΠ½ΠΎΠ² ΠΈ ΠΎΠ±ΠΎΠ±Ρ‰Π°ΡŽΡ‚ΡΡ Π² ΠΎΠ΄ΠΈΠ½ ΠΈΠ· Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… классов. Однако ΠΈΡ… ΠΌΠΎΠΆΠ½ΠΎ ΠΎΡ‡Π΅Π½ΡŒ быстро Π°Π΄Π°ΠΏΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π² рСгрСссионныС ΠΌΠΎΠ΄Π΅Π»ΠΈ, Ссли ΠΈΠ·ΠΌΠ΅Π½ΠΈΡ‚ΡŒ послСднюю Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ.

ΠšΠ°ΠΆΠ΄Ρ‹ΠΉ Π½Π΅ΠΉΡ€ΠΎΠ½ ΠΏΠ΅Ρ€Π΅Π΄Π°Π΅Ρ‚ значСния ΠΈΠ· ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰Π΅ΠΉ связи Ρ‡Π΅Ρ€Π΅Π· Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ, ΡΠ»ΡƒΠΆΠ°Ρ‰ΡƒΡŽ Ρ†Π΅Π»ΠΈ обобщСния ΠΈ нСлинСйности. ΠžΠ±Ρ‹Ρ‡Π½ΠΎ активационная функция β€” это Ρ‡Ρ‚ΠΎ-Ρ‚ΠΎ Π²Ρ€ΠΎΠ΄Π΅ сигмоиды ΠΈΠ»ΠΈ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ReLU (выпрямлСнный Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹ΠΉ Π±Π»ΠΎΠΊ).

срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π€ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии
Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ. Π‘Π²ΠΎΠ±ΠΎΠ΄Π½ΠΎΠ΅ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅

Но, Π·Π°ΠΌΠ΅Π½ΠΈΠ² послСднюю Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ (Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠΉ Π½Π΅ΠΉΡ€ΠΎΠ½) Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ, Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠΉ сигнал ΠΌΠΎΠΆΠ½ΠΎ ΠΎΡ‚ΠΎΠ±Ρ€Π°Π·ΠΈΡ‚ΡŒ Π½Π° мноТСство Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ, выходящих Π·Π° ΠΏΡ€Π΅Π΄Π΅Π»Ρ‹ фиксированных классов. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Π½Π° Π²Ρ‹Ρ…ΠΎΠ΄Π΅ Π±ΡƒΠ΄Π΅Ρ‚ Π½Π΅ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ отнСсСния Π²Ρ…ΠΎΠ΄Π½ΠΎΠ³ΠΎ сигнала ΠΊ ΠΊΠ°ΠΊΠΎΠΌΡƒ-Π»ΠΈΠ±ΠΎ ΠΎΠ΄Π½ΠΎΠΌΡƒ классу, Π° Π½Π΅ΠΏΡ€Π΅Ρ€Ρ‹Π²Π½ΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅, Π½Π° ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ фиксируСт свои наблюдСния нСйронная ΡΠ΅Ρ‚ΡŒ. Π’ этом смыслС ΠΌΠΎΠΆΠ½ΠΎ ΡΠΊΠ°Π·Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ нСйронная ΡΠ΅Ρ‚ΡŒ ΠΊΠ°ΠΊ Π±Ρ‹ дополняСт Π»ΠΈΠ½Π΅ΠΉΠ½ΡƒΡŽ Ρ€Π΅Π³Ρ€Π΅ΡΡΠΈΡŽ.

НСйросСтСвая рСгрСссия ΠΈΠΌΠ΅Π΅Ρ‚ прСимущСство нСлинСйности (Π² Π΄ΠΎΠΏΠΎΠ»Π½Π΅Π½ΠΈΠ΅ ΠΊ слоТности), ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ ΠΌΠΎΠΆΠ½ΠΎ ввСсти с сигмоидной ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠΌΠΈ Π½Π΅Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹ΠΌΠΈ функциями Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ Ρ€Π°Π½Π΅Π΅ Π² Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти. Однако Ρ‡Ρ€Π΅Π·ΠΌΠ΅Ρ€Π½ΠΎΠ΅ использованиС ReLU Π² качСствС Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ ΠΌΠΎΠΆΠ΅Ρ‚ ΠΎΠ·Π½Π°Ρ‡Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ модСль ΠΈΠΌΠ΅Π΅Ρ‚ Ρ‚Π΅Π½Π΄Π΅Π½Ρ†ΠΈΡŽ ΠΈΠ·Π±Π΅Π³Π°Ρ‚ΡŒ Π²Ρ‹Π²ΠΎΠ΄Π° ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ ReLU ΠΈΠ³Π½ΠΎΡ€ΠΈΡ€ΡƒΠ΅Ρ‚ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ различия ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ значСниями.

Π­Ρ‚ΠΎ ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π΅ΡˆΠΈΡ‚ΡŒ Π»ΠΈΠ±ΠΎ ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΠ΅ΠΌ использования ReLU ΠΈ Π΄ΠΎΠ±Π°Π²Π»Π΅Π½ΠΈΠ΅ΠΌ большСго количСства ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΡ… Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ, Π»ΠΈΠ±ΠΎ Π½ΠΎΡ€ΠΌΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠ΅ΠΉ Π΄Π°Π½Π½Ρ‹Ρ… Π΄ΠΎ строго ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ Π΄ΠΈΠ°ΠΏΠ°Π·ΠΎΠ½Π° ΠΏΠ΅Ρ€Π΅Π΄ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ΠΌ.

РСализация

Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ Keras, построим структуру искусствСнной Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти, хотя Ρ‚ΠΎ ΠΆΠ΅ самоС ΠΌΠΎΠΆΠ½ΠΎ Π±Ρ‹Π»ΠΎ Π±Ρ‹ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ со свСрточной Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ ΡΠ΅Ρ‚ΡŒΡŽ ΠΈΠ»ΠΈ Π΄Ρ€ΡƒΠ³ΠΎΠΉ ΡΠ΅Ρ‚ΡŒΡŽ, Ссли послСдний слой являСтся Π»ΠΈΠ±ΠΎ ΠΏΠ»ΠΎΡ‚Π½Ρ‹ΠΌ слоСм с Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠ΅ΠΉ, Π»ΠΈΠ±ΠΎ просто слоСм с Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠ΅ΠΉ. (ΠžΠ±Ρ€Π°Ρ‚ΠΈΡ‚Π΅ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅, Ρ‡Ρ‚ΠΎ ΠΈΠΌΠΏΠΎΡ€Ρ‚Ρ‹ Keras Π½Π΅ ΡƒΠΊΠ°Π·Π°Π½Ρ‹ для экономии мСста).

model = Sequential()
model.add(Dense(100, input_dim=3, activation=’sigmoid’))
model.add(ReLU(alpha=1.0))
model.add(Dense(50, activation=’sigmoid’))
model.add(ReLU(alpha=1.0))
model.add(Dense(25, activation=’softmax’))

#IMPORTANT PART
model.add(Dense(1, activation=’linear’))

ΠŸΡ€ΠΎΠ±Π»Π΅ΠΌΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Ρ… сСтСй всСгда Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π»Π°ΡΡŒ Π² ΠΈΡ… высокой диспСрсии ΠΈ склонности ΠΊ ΠΏΠ΅Ρ€Π΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΡŽ. Π’ ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½Π½ΠΎΠΌ Π²Ρ‹ΡˆΠ΅ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅ ΠΊΠΎΠ΄Π° ΠΌΠ½ΠΎΠ³ΠΎ источников нСлинСйности, Ρ‚Π°ΠΊΠΈΡ… ΠΊΠ°ΠΊ SoftMax ΠΈΠ»ΠΈ sigmoid.

Если ваша нСйронная ΡΠ΅Ρ‚ΡŒ Ρ…ΠΎΡ€ΠΎΡˆΠΎ справляСтся с ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠΌΠΈ Π΄Π°Π½Π½Ρ‹ΠΌΠΈ с чисто Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ структурой, Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ, Π»ΡƒΡ‡ΡˆΠ΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Ρ€Π΅Π³Ρ€Π΅ΡΡΠΈΡŽ с усСчСнным Π΄Π΅Ρ€Π΅Π²ΠΎΠΌ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ, которая эмулируСт Π»ΠΈΠ½Π΅ΠΉΠ½ΡƒΡŽ ΠΈ Π²Ρ‹ΡΠΎΠΊΠΎΠ΄ΠΈΡΠΏΠ΅Ρ€ΡΠ½ΡƒΡŽ Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΡƒΡŽ ΡΠ΅Ρ‚ΡŒ, Π½ΠΎ позволяСт Π΄Π°Ρ‚Π°-сайСнтисту Π»ΡƒΡ‡ΡˆΠ΅ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π³Π»ΡƒΠ±ΠΈΠ½Ρƒ, ΡˆΠΈΡ€ΠΈΠ½Ρƒ ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚Ρ‹ для контроля пСрСобучСния.

2. РСгрСссия Π΄Π΅Ρ€Π΅Π²Π° Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ

ВСория

Π”Π΅Ρ€Π΅Π²ΡŒΡ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ Π² классификации ΠΈ рСгрСссии ΠΎΡ‡Π΅Π½ΡŒ ΠΏΠΎΡ…ΠΎΠΆΠΈ, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‚ ΠΏΡƒΡ‚Π΅ΠΌ построСния Π΄Π΅Ρ€Π΅Π²ΡŒΠ΅Π² с ΡƒΠ·Π»Π°ΠΌΠΈ Β«Π΄Π°/Π½Π΅Ρ‚Β». Однако Π² Ρ‚ΠΎ врСмя ΠΊΠ°ΠΊ ΠΊΠΎΠ½Π΅Ρ‡Π½Ρ‹Π΅ ΡƒΠ·Π»Ρ‹ классификации приводят ΠΊ ΠΎΠ΄Π½ΠΎΠΌΡƒ Π·Π½Π°Ρ‡Π΅Π½ΠΈΡŽ класса (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, 1 ΠΈΠ»ΠΈ 0 для Π·Π°Π΄Π°Ρ‡ΠΈ Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ классификации), Π΄Π΅Ρ€Π΅Π²ΡŒΡ рСгрСссии Π·Π°ΠΊΠ°Π½Ρ‡ΠΈΠ²Π°ΡŽΡ‚ΡΡ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ΠΌ Π² Π½Π΅ΠΏΡ€Π΅Ρ€Ρ‹Π²Π½ΠΎΠΌ Ρ€Π΅ΠΆΠΈΠΌΠ΅ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, 4593,49 ΠΈΠ»ΠΈ 10,98).

срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π€ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии
Π˜Π»Π»ΡŽΡΡ‚Ρ€Π°Ρ†ΠΈΡ Π°Π²Ρ‚ΠΎΡ€Π°

Из-Π·Π° спСцифичСской ΠΈ высокодиспСрсной ΠΏΡ€ΠΈΡ€ΠΎΠ΄Ρ‹ рСгрСссии просто ΠΊΠ°ΠΊ Π·Π°Π΄Π°Ρ‡ΠΈ машинного обучСния, рСгрСссоры Π΄Π΅Ρ€Π΅Π²Π° Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ слСдуСт Ρ‚Ρ‰Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ ΠΎΠ±Ρ€Π΅Π·Π°Ρ‚ΡŒ. Π’Π΅ΠΌ Π½Π΅ ΠΌΠ΅Π½Π΅Π΅, ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ ΠΊ рСгрСссии нСрСгулярСн β€” вмСсто Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π²Ρ‹Ρ‡ΠΈΡΠ»ΡΡ‚ΡŒ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Π² Π½Π΅ΠΏΡ€Π΅Ρ€Ρ‹Π²Π½ΠΎΠΌ ΠΌΠ°ΡΡˆΡ‚Π°Π±Π΅, ΠΎΠ½ ΠΏΡ€ΠΈΡ…ΠΎΠ΄ΠΈΡ‚ ΠΊ Π·Π°Π΄Π°Π½Π½Ρ‹ΠΌ ΠΊΠΎΠ½Π΅Ρ‡Π½Ρ‹ΠΌ ΡƒΠ·Π»Π°ΠΌ. Если рСгрСссор ΠΎΠ±Ρ€Π΅Π·Π°Π½ слишком сильно, Ρƒ Π½Π΅Π³ΠΎ слишком ΠΌΠ°Π»ΠΎ ΠΊΠΎΠ½Π΅Ρ‡Π½Ρ‹Ρ… ΡƒΠ·Π»ΠΎΠ², Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π΄ΠΎΠ»ΠΆΠ½Ρ‹ΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ Π²Ρ‹ΠΏΠΎΠ»Π½ΠΈΡ‚ΡŒ свою Π·Π°Π΄Π°Ρ‡Ρƒ.

Π‘Π»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, Π΄Π΅Ρ€Π΅Π²ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ Π΄ΠΎΠ»ΠΆΠ½ΠΎ Π±Ρ‹Ρ‚ΡŒ ΠΎΠ±Ρ€Π΅Π·Π°Π½ΠΎ Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ½ΠΎ ΠΈΠΌΠ΅Π»ΠΎ Π½Π°ΠΈΠ±ΠΎΠ»ΡŒΡˆΡƒΡŽ свободу (Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Π΅ Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Π΅ значСния рСгрСссии β€” количСство ΠΊΠΎΠ½Π΅Ρ‡Π½Ρ‹Ρ… ΡƒΠ·Π»ΠΎΠ²), Π½ΠΎ нСдостаточно, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ½ΠΎ Π±Ρ‹Π»ΠΎ слишком Π³Π»ΡƒΠ±ΠΎΠΊΠΈΠΌ. Если Π΅Π³ΠΎ Π½Π΅ ΠΎΠ±Ρ€Π΅Π·Π°Ρ‚ΡŒ, Ρ‚ΠΎ ΠΈ Π±Π΅Π· Ρ‚ΠΎΠ³ΠΎ высокодиспСрсный Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ станСт Ρ‡Ρ€Π΅Π·ΠΌΠ΅Ρ€Π½ΠΎ слоТным ΠΈΠ·-Π·Π° ΠΏΡ€ΠΈΡ€ΠΎΠ΄Ρ‹ рСгрСссии.

РСализация

РСгрСссия Π΄Π΅Ρ€Π΅Π²Π° Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Π»Π΅Π³ΠΊΠΎ создана Π² sklearn :

Бонус: Π±Π»ΠΈΠ·ΠΊΠΈΠΉ родствСнник Π΄Π΅Ρ€Π΅Π²Π° Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ, Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ random forest (Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ случайного лСса), Ρ‚Π°ΠΊΠΆΠ΅ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Ρ€Π΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Π½ Π² качСствС рСгрСссора. РСгрСссор случайного лСса ΠΌΠΎΠΆΠ΅Ρ‚ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ Π»ΡƒΡ‡ΡˆΠ΅ ΠΈΠ»ΠΈ Π½Π΅ Π»ΡƒΡ‡ΡˆΠ΅, Ρ‡Π΅ΠΌ Π΄Π΅Ρ€Π΅Π²ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ Π² рСгрСссии (Π² Ρ‚ΠΎ врСмя ΠΊΠ°ΠΊ ΠΎΠ½ ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π»ΡƒΡ‡ΡˆΠ΅ Π² классификации) ΠΈΠ·-Π·Π° Ρ‚ΠΎΠ½ΠΊΠΎΠ³ΠΎ баланса ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΈΠ·Π±Ρ‹Ρ‚ΠΎΡ‡Π½Ρ‹ΠΌ ΠΈ нСдостаточным Π² ΠΏΡ€ΠΈΡ€ΠΎΠ΄Π΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² построСния Π΄Π΅Ρ€Π΅Π²Π°.

3. РСгрСссия LASSO

ΠœΠ΅Ρ‚ΠΎΠ΄ рСгрСссии лассо (LASSO, Least Absolute Shrinkage and Selection Operator) β€” это вариация Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ рСгрСссии, ΡΠΏΠ΅Ρ†ΠΈΠ°Π»ΡŒΠ½ΠΎ адаптированная для Π΄Π°Π½Π½Ρ‹Ρ…, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π΄Π΅ΠΌΠΎΠ½ΡΡ‚Ρ€ΠΈΡ€ΡƒΡŽΡ‚ ΡΠΈΠ»ΡŒΠ½ΡƒΡŽ ΠΌΡƒΠ»ΡŒΡ‚ΠΈΠΊΠΎΠ»Π»ΠΈΠ½Π΅Π°Ρ€Π½ΠΎΡΡ‚ΡŒ (Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ ΡΠΈΠ»ΡŒΠ½ΡƒΡŽ ΠΊΠΎΡ€Ρ€Π΅Π»ΡΡ†ΠΈΡŽ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² Π΄Ρ€ΡƒΠ³ с Π΄Ρ€ΡƒΠ³ΠΎΠΌ).

Она Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΠ·ΠΈΡ€ΡƒΠ΅Ρ‚ части Π²Ρ‹Π±ΠΎΡ€Π° ΠΌΠΎΠ΄Π΅Π»ΠΈ, Ρ‚Π°ΠΊΠΈΠ΅ ΠΊΠ°ΠΊ Π²Ρ‹Π±ΠΎΡ€ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ… ΠΈΠ»ΠΈ ΠΈΡΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ². LASSO ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ сТатиС коэффициСнтов (shrinkage), Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ процСсс, Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ значСния Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΡ€ΠΈΠ±Π»ΠΈΠΆΠ°ΡŽΡ‚ΡΡ ΠΊ Ρ†Π΅Π½Ρ‚Ρ€Π°Π»ΡŒΠ½ΠΎΠΉ Ρ‚ΠΎΡ‡ΠΊΠ΅ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€ срСднСму Π·Π½Π°Ρ‡Π΅Π½ΠΈΡŽ).

срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π€ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии
Π˜Π»Π»ΡŽΡΡ‚Ρ€Π°Ρ†ΠΈΡ Π°Π²Ρ‚ΠΎΡ€Π°. УпрощСнная визуализация процСсса сТатия

ΠŸΡ€ΠΎΡ†Π΅ΡΡ сТатия добавляСт рСгрСссионным модСлям нСсколько прСимущСств:

РСгрСссия лассо ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ Ρ€Π΅Π³ΡƒΠ»ΡΡ€ΠΈΠ·Π°Ρ†ΠΈΡŽ L1, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ Π²Π·Π²Π΅ΡˆΠΈΠ²Π°Π΅Ρ‚ ошибки ΠΏΠΎ ΠΈΡ… Π°Π±ΡΠΎΠ»ΡŽΡ‚Π½ΠΎΠΌΡƒ Π·Π½Π°Ρ‡Π΅Π½ΠΈΡŽ. ВмСсто, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, рСгуляризации L2, которая Π²Π·Π²Π΅ΡˆΠΈΠ²Π°Π΅Ρ‚ ошибки ΠΏΠΎ ΠΈΡ… ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚Ρƒ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ сильнСС Π½Π°ΠΊΠ°Π·Ρ‹Π²Π°Ρ‚ΡŒ Π·Π° Π±ΠΎΠ»Π΅Π΅ Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ошибки.

Вакая рСгуляризация часто ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΡ‚ ΠΊ Π±ΠΎΠ»Π΅Π΅ Ρ€Π°Π·Ρ€Π΅ΠΆΠ΅Π½Π½Ρ‹ΠΌ модСлям с мСньшим количСством коэффициСнтов, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ коэффициСнты ΠΌΠΎΠ³ΡƒΡ‚ ΡΡ‚Π°Ρ‚ΡŒ Π½ΡƒΠ»Π΅Π²Ρ‹ΠΌΠΈ ΠΈ, ΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, Π±ΡƒΠ΄ΡƒΡ‚ ΠΈΡΠΊΠ»ΡŽΡ‡Π΅Π½Ρ‹ ΠΈΠ· ΠΌΠΎΠ΄Π΅Π»ΠΈ. Π­Ρ‚ΠΎ позволяСт Π΅Π΅ ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ.

РСализация

Π’ sklearn рСгрСссия лассо поставляСтся с модСлью пСрСкрСстной ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ, которая Π²Ρ‹Π±ΠΈΡ€Π°Π΅Ρ‚ Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ эффСктивныС ΠΈΠ· ΠΌΠ½ΠΎΠ³ΠΈΡ… ΠΎΠ±ΡƒΡ‡Π΅Π½Π½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ с Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹ΠΌΠΈ Ρ„ΡƒΠ½Π΄Π°ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½Ρ‹ΠΌΠΈ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π°ΠΌΠΈ ΠΈ путями обучСния, Ρ‡Ρ‚ΠΎ Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΠ·ΠΈΡ€ΡƒΠ΅Ρ‚ Π·Π°Π΄Π°Ρ‡Ρƒ, ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ ΠΈΠ½Π°Ρ‡Π΅ ΠΏΡ€ΠΈΡˆΠ»ΠΎΡΡŒ Π±Ρ‹ Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡ‚ΡŒ Π²Ρ€ΡƒΡ‡Π½ΡƒΡŽ.

4. ГрСбнСвая рСгрСссия (Ρ€ΠΈΠ΄ΠΆ-рСгрСссия)

ВСория

ГрСбнСвая рСгрСссия ΠΈΠ»ΠΈ Ρ€ΠΈΠ΄ΠΆ-рСгрСссия ΠΎΡ‡Π΅Π½ΡŒ ΠΏΠΎΡ…ΠΎΠΆΠ° Π½Π° Ρ€Π΅Π³Ρ€Π΅ΡΡΠΈΡŽ LASSO Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΠΎΠ½Π° примСняСт сТатиС. Оба Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Ρ…ΠΎΡ€ΠΎΡˆΠΎ подходят для Π½Π°Π±ΠΎΡ€ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ… с большим количСством ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π½Π΅ ΡΠ²Π»ΡΡŽΡ‚ΡΡ нСзависимыми Π΄Ρ€ΡƒΠ³ ΠΎΡ‚ Π΄Ρ€ΡƒΠ³Π° (ΠΊΠΎΠ»Π»ΠΈΠ½Π΅Π°Ρ€Π½ΠΎΡΡ‚ΡŒ).

Однако самоС большоС Ρ€Π°Π·Π»ΠΈΡ‡ΠΈΠ΅ ΠΌΠ΅ΠΆΠ΄Ρƒ Π½ΠΈΠΌΠΈ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ грСбнСвая рСгрСссия ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ Ρ€Π΅Π³ΡƒΠ»ΡΡ€ΠΈΠ·Π°Ρ†ΠΈΡŽ L2, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ Π½ΠΈ ΠΎΠ΄ΠΈΠ½ ΠΈΠ· коэффициСнтов Π½Π΅ становится Π½ΡƒΠ»Π΅Π²Ρ‹ΠΌ, ΠΊΠ°ΠΊ это происходит Π² рСгрСссии LASSO. ВмСсто этого коэффициСнты всё большС ΠΏΡ€ΠΈΠ±Π»ΠΈΠΆΠ°ΡŽΡ‚ΡΡ ΠΊ Π½ΡƒΠ»ΡŽ, Π½ΠΎ Π½Π΅ ΠΈΠΌΠ΅ΡŽΡ‚ большого стимула Π΄ΠΎΡΡ‚ΠΈΡ‡ΡŒ Π΅Π³ΠΎ ΠΈΠ·-Π·Π° ΠΏΡ€ΠΈΡ€ΠΎΠ΄Ρ‹ рСгуляризации L2.

срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π€ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии
Π‘Ρ€Π°Π²Π½Π΅Π½ΠΈΠ΅ ошибок Π² рСгрСссии лассо (слСва) ΠΈ Π³Ρ€Π΅Π±Π½Π΅Π²ΠΎΠΉ рСгрСссии (справа). ΠŸΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ грСбнСвая рСгрСссия ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ Ρ€Π΅Π³ΡƒΠ»ΡΡ€ΠΈΠ·Π°Ρ†ΠΈΡŽ L2, Π΅Π΅ ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ Π½Π°ΠΏΠΎΠΌΠΈΠ½Π°Π΅Ρ‚ ΠΊΡ€ΡƒΠ³, Ρ‚ΠΎΠ³Π΄Π° ΠΊΠ°ΠΊ рСгуляризация лассо L1 рисуСт прямыС Π»ΠΈΠ½ΠΈΠΈ. Π‘Π²ΠΎΠ±ΠΎΠ΄Π½ΠΎΠ΅ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅. Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Π’ лассо ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΠ΅ ΠΎΡ‚ ошибки 5 Π΄ΠΎ ошибки 4 Π²Π·Π²Π΅ΡˆΠΈΠ²Π°Π΅Ρ‚ΡΡ Ρ‚Π°ΠΊ ΠΆΠ΅, ΠΊΠ°ΠΊ ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΠ΅ ΠΎΡ‚ 4 Π΄ΠΎ 3, Π° Ρ‚Π°ΠΊΠΆΠ΅ ΠΎΡ‚ 3 Π΄ΠΎ 2, ΠΎΡ‚ 2 Π΄ΠΎ 1 ΠΈ ΠΎΡ‚ 1 Π΄ΠΎ 0. Π‘Π»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, большС коэффициСнтов достигаСт нуля ΠΈ устраняСтся большС ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ².

Однако Π² Π³Ρ€Π΅Π±Π½Π΅Π²ΠΎΠΉ рСгрСссии ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΠ΅ ΠΎΡ‚ ошибки 5 Π΄ΠΎ ошибки 4 вычисляСтся ΠΊΠ°ΠΊ 5Β² βˆ’ 4Β² = 9, Ρ‚ΠΎΠ³Π΄Π° ΠΊΠ°ΠΊ ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΠ΅ ΠΎΡ‚ 4 Π΄ΠΎ 3 Π²Π·Π²Π΅ΡˆΠΈΠ²Π°Π΅Ρ‚ΡΡ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΊΠ°ΠΊ 7. ΠŸΠΎΡΡ‚Π΅ΠΏΠ΅Π½Π½ΠΎ Π²ΠΎΠ·Π½Π°Π³Ρ€Π°ΠΆΠ΄Π΅Π½ΠΈΠ΅ Π·Π° ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΠ΅ ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Π΅Ρ‚ΡΡ; ΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, устраняСтся мСньшС ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ².

ГрСбнСвая рСгрСссия Π»ΡƒΡ‡ΡˆΠ΅ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΈΡ‚ Π² ситуации, ΠΊΠΎΠ³Π΄Π° ΠΌΡ‹ Ρ…ΠΎΡ‚ΠΈΠΌ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ ΠΏΡ€ΠΈΠΎΡ€ΠΈΡ‚Π΅Ρ‚Π½Ρ‹ΠΌΠΈ большоС количСство ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ…, каТдая ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΈΠΌΠ΅Π΅Ρ‚ нСбольшой эффСкт. Если Π² ΠΌΠΎΠ΄Π΅Π»ΠΈ трСбуСтся ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°Ρ‚ΡŒ нСсколько ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ…, каТдая ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΈΠΌΠ΅Π΅Ρ‚ срСдний ΠΈΠ»ΠΈ большой эффСкт, Π»ΡƒΡ‡ΡˆΠΈΠΌ Π²Ρ‹Π±ΠΎΡ€ΠΎΠΌ Π±ΡƒΠ΄Π΅Ρ‚ лассо.

РСализация

Π“Ρ€Π΅Π±Π½Π΅Π²ΡƒΡŽ Ρ€Π΅Π³Ρ€Π΅ΡΡΠΈΡŽ Π² sklearn ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ (см. Π½ΠΈΠΆΠ΅). Как ΠΈ для рСгрСссии лассо, Π² sklearn Π΅ΡΡ‚ΡŒ рСализация для пСрСкрСстной ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ Π²Ρ‹Π±ΠΎΡ€Π° Π»ΡƒΡ‡ΡˆΠΈΡ… ΠΈΠ· ΠΌΠ½ΠΎΠ³ΠΈΡ… ΠΎΠ±ΡƒΡ‡Π΅Π½Π½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ.

5. РСгрСссия ElasticNet

ВСория

ElasticNet стрСмится ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΠΈΡ‚ΡŒ Π»ΡƒΡ‡ΡˆΠ΅Π΅ ΠΈΠ· Π³Ρ€Π΅Π±Π½Π΅Π²ΠΎΠΉ рСгрСссии ΠΈ рСгрСссии лассо, комбинируя Ρ€Π΅Π³ΡƒΠ»ΡΡ€ΠΈΠ·Π°Ρ†ΠΈΡŽ L1 ΠΈ L2.

Лассо ΠΈ грСбнСвая рСгрСссия ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΡŽΡ‚ собой Π΄Π²Π° Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… ΠΌΠ΅Ρ‚ΠΎΠ΄Π° рСгуляризации. Π’ ΠΎΠ±ΠΎΠΈΡ… случаях Ξ» β€” это ΠΊΠ»ΡŽΡ‡Π΅Π²ΠΎΠΉ Ρ„Π°ΠΊΡ‚ΠΎΡ€, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΠΈΡ€ΡƒΠ΅Ρ‚ Ρ€Π°Π·ΠΌΠ΅Ρ€ ΡˆΡ‚Ρ€Π°Ρ„Π°:

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

5 Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² рСгрСссии Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ, ΠΎ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π²Π°ΠΌ слСдуСт Π·Π½Π°Ρ‚ΡŒ

Π‘Ρ‹ΡΡ‚Ρ€Π΅Π½ΡŒΠΊΠΎ Π½Π°Π·ΠΎΠ²ΠΈΡ‚Π΅ ΠΏΡΡ‚ΡŒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² машинного обучСния. Вряд Π»ΠΈ Π²Ρ‹ Π½Π°Π·ΠΎΠ²Π΅Ρ‚Π΅ ΠΌΠ½ΠΎΠ³ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² рСгрСссии. Π’ ΠΊΠΎΠ½Ρ†Π΅ ΠΊΠΎΠ½Ρ†ΠΎΠ², СдинствСнным ΡˆΠΈΡ€ΠΎΠΊΠΎ распространСнным Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠΌ рСгрСссии являСтся линСйная рСгрСссия, Π³Π»Π°Π²Π½Ρ‹ΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ ΠΈΠ·-Π·Π° Π΅Π΅ простоты.

Однако линСйная рСгрСссия часто Π½Π΅ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΠΌΠ° ΠΊ Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹ΠΌ Π΄Π°Π½Π½Ρ‹ΠΌ ΠΈΠ·-Π·Π° слишком ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Π½Ρ‹Ρ… возмоТностСй ΠΈ ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Π½ΠΎΠΉ свободы ΠΌΠ°Π½Π΅Π²Ρ€Π°. Π•Π΅ часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π² качСствС Π±Π°Π·ΠΎΠ²ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ для ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΈ сравнСния с Π½ΠΎΠ²Ρ‹ΠΌΠΈ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Π°ΠΌΠΈ Π² исслСдованиях.

ΠŸΠ΅Ρ€Π΅Π²Π΅Π»ΠΈ ΡΡ‚Π°Ρ‚ΡŒΡŽ, Π°Π²Ρ‚ΠΎΡ€ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ описываСт 5 Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² рСгрСссии. Π˜Ρ… стоит ΠΈΠΌΠ΅Ρ‚ΡŒ Π² своСм Π½Π°Π±ΠΎΡ€Π΅ инструмСнтов наряду с популярными Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°ΠΌΠΈ классификации, Ρ‚Π°ΠΊΠΈΠΌΠΈ ΠΊΠ°ΠΊ SVM, Π΄Π΅Ρ€Π΅Π²ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ ΠΈ Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Π΅ сСти.

1. НСйросСтСвая рСгрСссия

ВСория. НСйронныС сСти нСвСроятно ΠΌΠΎΡ‰Π½Ρ‹Π΅, Π½ΠΎ ΠΈΡ… ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ для классификации. Π‘ΠΈΠ³Π½Π°Π»Ρ‹ проходят Ρ‡Π΅Ρ€Π΅Π· слои Π½Π΅ΠΉΡ€ΠΎΠ½ΠΎΠ² ΠΈ ΠΎΠ±ΠΎΠ±Ρ‰Π°ΡŽΡ‚ΡΡ Π² ΠΎΠ΄ΠΈΠ½ ΠΈΠ· Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… классов. Однако ΠΈΡ… ΠΌΠΎΠΆΠ½ΠΎ ΠΎΡ‡Π΅Π½ΡŒ быстро Π°Π΄Π°ΠΏΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π² рСгрСссионныС ΠΌΠΎΠ΄Π΅Π»ΠΈ, Ссли ΠΈΠ·ΠΌΠ΅Π½ΠΈΡ‚ΡŒ послСднюю Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ.

ΠšΠ°ΠΆΠ΄Ρ‹ΠΉ Π½Π΅ΠΉΡ€ΠΎΠ½ ΠΏΠ΅Ρ€Π΅Π΄Π°Π΅Ρ‚ значСния ΠΈΠ· ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰Π΅ΠΉ связи Ρ‡Π΅Ρ€Π΅Π· Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ, ΡΠ»ΡƒΠΆΠ°Ρ‰ΡƒΡŽ Ρ†Π΅Π»ΠΈ обобщСния ΠΈ нСлинСйности. ΠžΠ±Ρ‹Ρ‡Π½ΠΎ активационная функция β€” это Ρ‡Ρ‚ΠΎ-Ρ‚ΠΎ Π²Ρ€ΠΎΠ΄Π΅ сигмоиды ΠΈΠ»ΠΈ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ReLU (выпрямлСнный Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹ΠΉ Π±Π»ΠΎΠΊ).

срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π€ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии

Но, Π·Π°ΠΌΠ΅Π½ΠΈΠ² послСднюю Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ (Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠΉ Π½Π΅ΠΉΡ€ΠΎΠ½) Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ, Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠΉ сигнал ΠΌΠΎΠΆΠ½ΠΎ ΠΎΡ‚ΠΎΠ±Ρ€Π°Π·ΠΈΡ‚ΡŒ Π½Π° мноТСство Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ, выходящих Π·Π° ΠΏΡ€Π΅Π΄Π΅Π»Ρ‹ фиксированных классов. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Π½Π° Π²Ρ‹Ρ…ΠΎΠ΄Π΅ Π±ΡƒΠ΄Π΅Ρ‚ Π½Π΅ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ отнСсСния Π²Ρ…ΠΎΠ΄Π½ΠΎΠ³ΠΎ сигнала ΠΊ ΠΊΠ°ΠΊΠΎΠΌΡƒ-Π»ΠΈΠ±ΠΎ ΠΎΠ΄Π½ΠΎΠΌΡƒ классу, Π° Π½Π΅ΠΏΡ€Π΅Ρ€Ρ‹Π²Π½ΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅, Π½Π° ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ фиксируСт свои наблюдСния нСйронная ΡΠ΅Ρ‚ΡŒ. Π’ этом смыслС ΠΌΠΎΠΆΠ½ΠΎ ΡΠΊΠ°Π·Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ нСйронная ΡΠ΅Ρ‚ΡŒ ΠΊΠ°ΠΊ Π±Ρ‹ дополняСт Π»ΠΈΠ½Π΅ΠΉΠ½ΡƒΡŽ Ρ€Π΅Π³Ρ€Π΅ΡΡΠΈΡŽ.

НСйросСтСвая рСгрСссия ΠΈΠΌΠ΅Π΅Ρ‚ прСимущСство нСлинСйности (Π² Π΄ΠΎΠΏΠΎΠ»Π½Π΅Π½ΠΈΠ΅ ΠΊ слоТности), ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ ΠΌΠΎΠΆΠ½ΠΎ ввСсти с сигмоидной ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠΌΠΈ Π½Π΅Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹ΠΌΠΈ функциями Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ Ρ€Π°Π½Π΅Π΅ Π² Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти. Однако Ρ‡Ρ€Π΅Π·ΠΌΠ΅Ρ€Π½ΠΎΠ΅ использованиС ReLU Π² качСствС Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ ΠΌΠΎΠΆΠ΅Ρ‚ ΠΎΠ·Π½Π°Ρ‡Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ модСль ΠΈΠΌΠ΅Π΅Ρ‚ Ρ‚Π΅Π½Π΄Π΅Π½Ρ†ΠΈΡŽ ΠΈΠ·Π±Π΅Π³Π°Ρ‚ΡŒ Π²Ρ‹Π²ΠΎΠ΄Π° ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ ReLU ΠΈΠ³Π½ΠΎΡ€ΠΈΡ€ΡƒΠ΅Ρ‚ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ различия ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ значСниями.

Π­Ρ‚ΠΎ ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π΅ΡˆΠΈΡ‚ΡŒ Π»ΠΈΠ±ΠΎ ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΠ΅ΠΌ использования ReLU ΠΈ Π΄ΠΎΠ±Π°Π²Π»Π΅Π½ΠΈΠ΅ΠΌ большСго количСства ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΡ… Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ, Π»ΠΈΠ±ΠΎ Π½ΠΎΡ€ΠΌΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠ΅ΠΉ Π΄Π°Π½Π½Ρ‹Ρ… Π΄ΠΎ строго ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ Π΄ΠΈΠ°ΠΏΠ°Π·ΠΎΠ½Π° ΠΏΠ΅Ρ€Π΅Π΄ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ΠΌ.

РСализация. Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ Keras, построим структуру искусствСнной Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти, хотя Ρ‚ΠΎ ΠΆΠ΅ самоС ΠΌΠΎΠΆΠ½ΠΎ Π±Ρ‹Π»ΠΎ Π±Ρ‹ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ со свСрточной Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ ΡΠ΅Ρ‚ΡŒΡŽ ΠΈΠ»ΠΈ Π΄Ρ€ΡƒΠ³ΠΎΠΉ ΡΠ΅Ρ‚ΡŒΡŽ, Ссли послСдний слой являСтся Π»ΠΈΠ±ΠΎ ΠΏΠ»ΠΎΡ‚Π½Ρ‹ΠΌ слоСм с Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠ΅ΠΉ, Π»ΠΈΠ±ΠΎ просто слоСм с Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠ΅ΠΉ. (ΠžΠ±Ρ€Π°Ρ‚ΠΈΡ‚Π΅ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅, Ρ‡Ρ‚ΠΎ ΠΈΠΌΠΏΠΎΡ€Ρ‚Ρ‹ Keras Π½Π΅ ΡƒΠΊΠ°Π·Π°Π½Ρ‹ для экономии мСста).

ΠŸΡ€ΠΎΠ±Π»Π΅ΠΌΠ° Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Ρ… сСтСй всСгда Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π»Π°ΡΡŒ Π² ΠΈΡ… высокой диспСрсии ΠΈ склонности ΠΊ ΠΏΠ΅Ρ€Π΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΡŽ. Π’ ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½Π½ΠΎΠΌ Π²Ρ‹ΡˆΠ΅ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅ ΠΊΠΎΠ΄Π° ΠΌΠ½ΠΎΠ³ΠΎ источников нСлинСйности, Ρ‚Π°ΠΊΠΈΡ… ΠΊΠ°ΠΊ SoftMax ΠΈΠ»ΠΈ sigmoid.

Если ваша нСйронная ΡΠ΅Ρ‚ΡŒ Ρ…ΠΎΡ€ΠΎΡˆΠΎ справляСтся с ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠΌΠΈ Π΄Π°Π½Π½Ρ‹ΠΌΠΈ с чисто Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ структурой, Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ, Π»ΡƒΡ‡ΡˆΠ΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Ρ€Π΅Π³Ρ€Π΅ΡΡΠΈΡŽ с усСчСнным Π΄Π΅Ρ€Π΅Π²ΠΎΠΌ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ, которая эмулируСт Π»ΠΈΠ½Π΅ΠΉΠ½ΡƒΡŽ ΠΈ Π²Ρ‹ΡΠΎΠΊΠΎΠ΄ΠΈΡΠΏΠ΅Ρ€ΡΠ½ΡƒΡŽ Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΡƒΡŽ ΡΠ΅Ρ‚ΡŒ, Π½ΠΎ позволяСт Π΄Π°Ρ‚Π°-сайСнтисту Π»ΡƒΡ‡ΡˆΠ΅ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π³Π»ΡƒΠ±ΠΈΠ½Ρƒ, ΡˆΠΈΡ€ΠΈΠ½Ρƒ ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚Ρ‹ для контроля пСрСобучСния.

2. РСгрСссия Π΄Π΅Ρ€Π΅Π²Π° Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ

ВСория. Π”Π΅Ρ€Π΅Π²ΡŒΡ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ Π² классификации ΠΈ рСгрСссии ΠΎΡ‡Π΅Π½ΡŒ ΠΏΠΎΡ…ΠΎΠΆΠΈ, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‚ ΠΏΡƒΡ‚Π΅ΠΌ построСния Π΄Π΅Ρ€Π΅Π²ΡŒΠ΅Π² с ΡƒΠ·Π»Π°ΠΌΠΈ Β«Π΄Π°/Π½Π΅Ρ‚Β». Однако Π² Ρ‚ΠΎ врСмя ΠΊΠ°ΠΊ ΠΊΠΎΠ½Π΅Ρ‡Π½Ρ‹Π΅ ΡƒΠ·Π»Ρ‹ классификации приводят ΠΊ ΠΎΠ΄Π½ΠΎΠΌΡƒ Π·Π½Π°Ρ‡Π΅Π½ΠΈΡŽ класса (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, 1 ΠΈΠ»ΠΈ 0 для Π·Π°Π΄Π°Ρ‡ΠΈ Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ классификации), Π΄Π΅Ρ€Π΅Π²ΡŒΡ рСгрСссии Π·Π°ΠΊΠ°Π½Ρ‡ΠΈΠ²Π°ΡŽΡ‚ΡΡ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ΠΌ Π² Π½Π΅ΠΏΡ€Π΅Ρ€Ρ‹Π²Π½ΠΎΠΌ Ρ€Π΅ΠΆΠΈΠΌΠ΅ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, 4593,49 ΠΈΠ»ΠΈ 10,98).

срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π€ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии

Из-Π·Π° спСцифичСской ΠΈ высокодиспСрсной ΠΏΡ€ΠΈΡ€ΠΎΠ΄Ρ‹ рСгрСссии просто ΠΊΠ°ΠΊ Π·Π°Π΄Π°Ρ‡ΠΈ машинного обучСния, рСгрСссоры Π΄Π΅Ρ€Π΅Π²Π° Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ слСдуСт Ρ‚Ρ‰Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ ΠΎΠ±Ρ€Π΅Π·Π°Ρ‚ΡŒ. Π’Π΅ΠΌ Π½Π΅ ΠΌΠ΅Π½Π΅Π΅, ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ ΠΊ рСгрСссии нСрСгулярСн β€” вмСсто Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π²Ρ‹Ρ‡ΠΈΡΠ»ΡΡ‚ΡŒ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Π² Π½Π΅ΠΏΡ€Π΅Ρ€Ρ‹Π²Π½ΠΎΠΌ ΠΌΠ°ΡΡˆΡ‚Π°Π±Π΅, ΠΎΠ½ ΠΏΡ€ΠΈΡ…ΠΎΠ΄ΠΈΡ‚ ΠΊ Π·Π°Π΄Π°Π½Π½Ρ‹ΠΌ ΠΊΠΎΠ½Π΅Ρ‡Π½Ρ‹ΠΌ ΡƒΠ·Π»Π°ΠΌ. Если рСгрСссор ΠΎΠ±Ρ€Π΅Π·Π°Π½ слишком сильно, Ρƒ Π½Π΅Π³ΠΎ слишком ΠΌΠ°Π»ΠΎ ΠΊΠΎΠ½Π΅Ρ‡Π½Ρ‹Ρ… ΡƒΠ·Π»ΠΎΠ², Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π΄ΠΎΠ»ΠΆΠ½Ρ‹ΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ Π²Ρ‹ΠΏΠΎΠ»Π½ΠΈΡ‚ΡŒ свою Π·Π°Π΄Π°Ρ‡Ρƒ.

Π‘Π»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, Π΄Π΅Ρ€Π΅Π²ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ Π΄ΠΎΠ»ΠΆΠ½ΠΎ Π±Ρ‹Ρ‚ΡŒ ΠΎΠ±Ρ€Π΅Π·Π°Π½ΠΎ Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ½ΠΎ ΠΈΠΌΠ΅Π»ΠΎ Π½Π°ΠΈΠ±ΠΎΠ»ΡŒΡˆΡƒΡŽ свободу (Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Π΅ Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Π΅ значСния рСгрСссии β€” количСство ΠΊΠΎΠ½Π΅Ρ‡Π½Ρ‹Ρ… ΡƒΠ·Π»ΠΎΠ²), Π½ΠΎ нСдостаточно, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ½ΠΎ Π±Ρ‹Π»ΠΎ слишком Π³Π»ΡƒΠ±ΠΎΠΊΠΈΠΌ. Если Π΅Π³ΠΎ Π½Π΅ ΠΎΠ±Ρ€Π΅Π·Π°Ρ‚ΡŒ, Ρ‚ΠΎ ΠΈ Π±Π΅Π· Ρ‚ΠΎΠ³ΠΎ высокодиспСрсный Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ станСт Ρ‡Ρ€Π΅Π·ΠΌΠ΅Ρ€Π½ΠΎ слоТным ΠΈΠ·-Π·Π° ΠΏΡ€ΠΈΡ€ΠΎΠ΄Ρ‹ рСгрСссии.

РСализация. РСгрСссия Π΄Π΅Ρ€Π΅Π²Π° Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Π»Π΅Π³ΠΊΠΎ создана Π² sklearn:

ΠŸΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ рСгрСссора Π΄Π΅Ρ€Π΅Π²Π° Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ ΠΎΡ‡Π΅Π½ΡŒ Π²Π°ΠΆΠ½Ρ‹, рСкомСндуСтся ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ инструмСнт ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ поиска ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² GridCV ΠΈΠ· sklearn, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π½Π°ΠΉΡ‚ΠΈ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Π΅ Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°Ρ†ΠΈΠΈ для этой ΠΌΠΎΠ΄Π΅Π»ΠΈ.

ΠŸΡ€ΠΈ Ρ„ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½ΠΎΠΉ ΠΎΡ†Π΅Π½ΠΊΠ΅ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠΉΡ‚Π΅ тСстированиС K-fold вмСсто стандартного train-test-split, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΈΠ·Π±Π΅ΠΆΠ°Ρ‚ΡŒ случайности послСднСго, которая ΠΌΠΎΠΆΠ΅Ρ‚ Π½Π°Ρ€ΡƒΡˆΠΈΡ‚ΡŒ Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ с высокой диспСрсиСй.

Бонус: Π±Π»ΠΈΠ·ΠΊΠΈΠΉ родствСнник Π΄Π΅Ρ€Π΅Π²Π° Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ, Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ random forest (Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ случайного лСса), Ρ‚Π°ΠΊΠΆΠ΅ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Ρ€Π΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Π½ Π² качСствС рСгрСссора. РСгрСссор случайного лСса ΠΌΠΎΠΆΠ΅Ρ‚ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ Π»ΡƒΡ‡ΡˆΠ΅ ΠΈΠ»ΠΈ Π½Π΅ Π»ΡƒΡ‡ΡˆΠ΅, Ρ‡Π΅ΠΌ Π΄Π΅Ρ€Π΅Π²ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ Π² рСгрСссии (Π² Ρ‚ΠΎ врСмя ΠΊΠ°ΠΊ ΠΎΠ½ ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π»ΡƒΡ‡ΡˆΠ΅ Π² классификации) ΠΈΠ·-Π·Π° Ρ‚ΠΎΠ½ΠΊΠΎΠ³ΠΎ баланса ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΈΠ·Π±Ρ‹Ρ‚ΠΎΡ‡Π½Ρ‹ΠΌ ΠΈ нСдостаточным Π² ΠΏΡ€ΠΈΡ€ΠΎΠ΄Π΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² построСния Π΄Π΅Ρ€Π΅Π²Π°.

3. РСгрСссия LASSO

ВСория. ΠœΠ΅Ρ‚ΠΎΠ΄ рСгрСссии лассо (LASSO, Least Absolute Shrinkage and Selection Operator) β€” это вариация Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ рСгрСссии, ΡΠΏΠ΅Ρ†ΠΈΠ°Π»ΡŒΠ½ΠΎ адаптированная для Π΄Π°Π½Π½Ρ‹Ρ…, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π΄Π΅ΠΌΠΎΠ½ΡΡ‚Ρ€ΠΈΡ€ΡƒΡŽΡ‚ ΡΠΈΠ»ΡŒΠ½ΡƒΡŽ ΠΌΡƒΠ»ΡŒΡ‚ΠΈΠΊΠΎΠ»Π»ΠΈΠ½Π΅Π°Ρ€Π½ΠΎΡΡ‚ΡŒ (Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ ΡΠΈΠ»ΡŒΠ½ΡƒΡŽ ΠΊΠΎΡ€Ρ€Π΅Π»ΡΡ†ΠΈΡŽ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² Π΄Ρ€ΡƒΠ³ с Π΄Ρ€ΡƒΠ³ΠΎΠΌ).

Она Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΠ·ΠΈΡ€ΡƒΠ΅Ρ‚ части Π²Ρ‹Π±ΠΎΡ€Π° ΠΌΠΎΠ΄Π΅Π»ΠΈ, Ρ‚Π°ΠΊΠΈΠ΅ ΠΊΠ°ΠΊ Π²Ρ‹Π±ΠΎΡ€ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ… ΠΈΠ»ΠΈ ΠΈΡΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ². LASSO ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ сТатиС коэффициСнтов (shrinkage), Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ процСсс, Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ значСния Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΡ€ΠΈΠ±Π»ΠΈΠΆΠ°ΡŽΡ‚ΡΡ ΠΊ Ρ†Π΅Π½Ρ‚Ρ€Π°Π»ΡŒΠ½ΠΎΠΉ Ρ‚ΠΎΡ‡ΠΊΠ΅ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€ срСднСму Π·Π½Π°Ρ‡Π΅Π½ΠΈΡŽ).

срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π€ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии

Π˜Π»Π»ΡŽΡΡ‚Ρ€Π°Ρ†ΠΈΡ Π°Π²Ρ‚ΠΎΡ€Π°. УпрощСнная визуализация процСсса сТатия

ΠŸΡ€ΠΎΡ†Π΅ΡΡ сТатия добавляСт рСгрСссионным модСлям нСсколько прСимущСств:

ВмСсто Ρ‚ΠΎΠ³ΠΎ Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΡΠ»ΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ, компСнсируя ΡΠ»ΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ Π΄Π°Π½Π½Ρ‹Ρ…, ΠΏΠΎΠ΄ΠΎΠ±Π½ΠΎ ΠΌΠ΅Ρ‚ΠΎΠ΄Π°ΠΌ рСгрСссии с высокой диспСрсиСй Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Ρ… сСтСй ΠΈ Π΄Π΅Ρ€Π΅Π²Π° Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ, лассо пытаСтся ΡƒΠΌΠ΅Π½ΡŒΡˆΠΈΡ‚ΡŒ ΡΠ»ΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ Π΄Π°Π½Π½Ρ‹Ρ… Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΈΡ… ΠΌΠΎΠΆΠ½ΠΎ Π±Ρ‹Π»ΠΎ ΠΎΠ±Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Ρ‚ΡŒ простыми ΠΌΠ΅Ρ‚ΠΎΠ΄Π°ΠΌΠΈ рСгрСссии, искривляя пространство, Π½Π° ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ ΠΎΠ½ΠΈ Π»Π΅ΠΆΠ°Ρ‚. Π’ этом процСссС лассо автоматичСски ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΡƒΡΡ‚Ρ€Π°Π½ΠΈΡ‚ΡŒ ΠΈΠ»ΠΈ ΠΈΡΠΊΠ°Π·ΠΈΡ‚ΡŒ сильно ΠΊΠΎΡ€Ρ€Π΅Π»ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹Π΅ ΠΈ ΠΈΠ·Π±Ρ‹Ρ‚ΠΎΡ‡Π½Ρ‹Π΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Π² ΠΌΠ΅Ρ‚ΠΎΠ΄Π΅ с Π½ΠΈΠ·ΠΊΠΎΠΉ диспСрсиСй.

РСгрСссия лассо ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ Ρ€Π΅Π³ΡƒΠ»ΡΡ€ΠΈΠ·Π°Ρ†ΠΈΡŽ L1, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ Π²Π·Π²Π΅ΡˆΠΈΠ²Π°Π΅Ρ‚ ошибки ΠΏΠΎ ΠΈΡ… Π°Π±ΡΠΎΠ»ΡŽΡ‚Π½ΠΎΠΌΡƒ Π·Π½Π°Ρ‡Π΅Π½ΠΈΡŽ. ВмСсто, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, рСгуляризации L2, которая Π²Π·Π²Π΅ΡˆΠΈΠ²Π°Π΅Ρ‚ ошибки ΠΏΠΎ ΠΈΡ… ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚Ρƒ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ сильнСС Π½Π°ΠΊΠ°Π·Ρ‹Π²Π°Ρ‚ΡŒ Π·Π° Π±ΠΎΠ»Π΅Π΅ Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ошибки.

Вакая рСгуляризация часто ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΡ‚ ΠΊ Π±ΠΎΠ»Π΅Π΅ Ρ€Π°Π·Ρ€Π΅ΠΆΠ΅Π½Π½Ρ‹ΠΌ модСлям с мСньшим количСством коэффициСнтов, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ коэффициСнты ΠΌΠΎΠ³ΡƒΡ‚ ΡΡ‚Π°Ρ‚ΡŒ Π½ΡƒΠ»Π΅Π²Ρ‹ΠΌΠΈ ΠΈ, ΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, Π±ΡƒΠ΄ΡƒΡ‚ ΠΈΡΠΊΠ»ΡŽΡ‡Π΅Π½Ρ‹ ΠΈΠ· ΠΌΠΎΠ΄Π΅Π»ΠΈ. Π­Ρ‚ΠΎ позволяСт Π΅Π΅ ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ.

РСализация. Π’ sklearn рСгрСссия лассо поставляСтся с модСлью пСрСкрСстной ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ, которая Π²Ρ‹Π±ΠΈΡ€Π°Π΅Ρ‚ Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ эффСктивныС ΠΈΠ· ΠΌΠ½ΠΎΠ³ΠΈΡ… ΠΎΠ±ΡƒΡ‡Π΅Π½Π½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ с Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹ΠΌΠΈ Ρ„ΡƒΠ½Π΄Π°ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½Ρ‹ΠΌΠΈ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π°ΠΌΠΈ ΠΈ путями обучСния, Ρ‡Ρ‚ΠΎ Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΠ·ΠΈΡ€ΡƒΠ΅Ρ‚ Π·Π°Π΄Π°Ρ‡Ρƒ, ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ ΠΈΠ½Π°Ρ‡Π΅ ΠΏΡ€ΠΈΡˆΠ»ΠΎΡΡŒ Π±Ρ‹ Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡ‚ΡŒ Π²Ρ€ΡƒΡ‡Π½ΡƒΡŽ.

4. ГрСбнСвая рСгрСссия (Ρ€ΠΈΠ΄ΠΆ-рСгрСссия)

ВСория. ГрСбнСвая рСгрСссия ΠΈΠ»ΠΈ Ρ€ΠΈΠ΄ΠΆ-рСгрСссия ΠΎΡ‡Π΅Π½ΡŒ ΠΏΠΎΡ…ΠΎΠΆΠ° Π½Π° Ρ€Π΅Π³Ρ€Π΅ΡΡΠΈΡŽ LASSO Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΠΎΠ½Π° примСняСт сТатиС. Оба Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Ρ…ΠΎΡ€ΠΎΡˆΠΎ подходят для Π½Π°Π±ΠΎΡ€ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ… с большим количСством ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π½Π΅ ΡΠ²Π»ΡΡŽΡ‚ΡΡ нСзависимыми Π΄Ρ€ΡƒΠ³ ΠΎΡ‚ Π΄Ρ€ΡƒΠ³Π° (ΠΊΠΎΠ»Π»ΠΈΠ½Π΅Π°Ρ€Π½ΠΎΡΡ‚ΡŒ).

Однако самоС большоС Ρ€Π°Π·Π»ΠΈΡ‡ΠΈΠ΅ ΠΌΠ΅ΠΆΠ΄Ρƒ Π½ΠΈΠΌΠΈ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ грСбнСвая рСгрСссия ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ Ρ€Π΅Π³ΡƒΠ»ΡΡ€ΠΈΠ·Π°Ρ†ΠΈΡŽ L2, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ Π½ΠΈ ΠΎΠ΄ΠΈΠ½ ΠΈΠ· коэффициСнтов Π½Π΅ становится Π½ΡƒΠ»Π΅Π²Ρ‹ΠΌ, ΠΊΠ°ΠΊ это происходит Π² рСгрСссии LASSO. ВмСсто этого коэффициСнты всё большС ΠΏΡ€ΠΈΠ±Π»ΠΈΠΆΠ°ΡŽΡ‚ΡΡ ΠΊ Π½ΡƒΠ»ΡŽ, Π½ΠΎ Π½Π΅ ΠΈΠΌΠ΅ΡŽΡ‚ большого стимула Π΄ΠΎΡΡ‚ΠΈΡ‡ΡŒ Π΅Π³ΠΎ ΠΈΠ·-Π·Π° ΠΏΡ€ΠΈΡ€ΠΎΠ΄Ρ‹ рСгуляризации L2.

срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии. Π€ΠΎΡ‚ΠΎ срСди ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ машинного обучСния ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии

Π‘Ρ€Π°Π²Π½Π΅Π½ΠΈΠ΅ ошибок Π² рСгрСссии лассо (слСва) ΠΈ Π³Ρ€Π΅Π±Π½Π΅Π²ΠΎΠΉ рСгрСссии (справа). ΠŸΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ грСбнСвая рСгрСссия ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ Ρ€Π΅Π³ΡƒΠ»ΡΡ€ΠΈΠ·Π°Ρ†ΠΈΡŽ L2, Π΅Π΅ ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ Π½Π°ΠΏΠΎΠΌΠΈΠ½Π°Π΅Ρ‚ ΠΊΡ€ΡƒΠ³, Ρ‚ΠΎΠ³Π΄Π° ΠΊΠ°ΠΊ рСгуляризация лассо L1 рисуСт прямыС Π»ΠΈΠ½ΠΈΠΈ. Π‘Π²ΠΎΠ±ΠΎΠ΄Π½ΠΎΠ΅ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅. Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Π’ лассо ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΠ΅ ΠΎΡ‚ ошибки 5 Π΄ΠΎ ошибки 4 Π²Π·Π²Π΅ΡˆΠΈΠ²Π°Π΅Ρ‚ΡΡ Ρ‚Π°ΠΊ ΠΆΠ΅, ΠΊΠ°ΠΊ ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΠ΅ ΠΎΡ‚ 4 Π΄ΠΎ 3, Π° Ρ‚Π°ΠΊΠΆΠ΅ ΠΎΡ‚ 3 Π΄ΠΎ 2, ΠΎΡ‚ 2 Π΄ΠΎ 1 ΠΈ ΠΎΡ‚ 1 Π΄ΠΎ 0. Π‘Π»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, большС коэффициСнтов достигаСт нуля ΠΈ устраняСтся большС ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ².

Однако Π² Π³Ρ€Π΅Π±Π½Π΅Π²ΠΎΠΉ рСгрСссии ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΠ΅ ΠΎΡ‚ ошибки 5 Π΄ΠΎ ошибки 4 вычисляСтся ΠΊΠ°ΠΊ 5Β² βˆ’ 4Β² = 9, Ρ‚ΠΎΠ³Π΄Π° ΠΊΠ°ΠΊ ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΠ΅ ΠΎΡ‚ 4 Π΄ΠΎ 3 Π²Π·Π²Π΅ΡˆΠΈΠ²Π°Π΅Ρ‚ΡΡ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΊΠ°ΠΊ 7. ΠŸΠΎΡΡ‚Π΅ΠΏΠ΅Π½Π½ΠΎ Π²ΠΎΠ·Π½Π°Π³Ρ€Π°ΠΆΠ΄Π΅Π½ΠΈΠ΅ Π·Π° ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΠ΅ ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Π΅Ρ‚ΡΡ; ΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, устраняСтся мСньшС ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ².

ГрСбнСвая рСгрСссия Π»ΡƒΡ‡ΡˆΠ΅ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΈΡ‚ Π² ситуации, ΠΊΠΎΠ³Π΄Π° ΠΌΡ‹ Ρ…ΠΎΡ‚ΠΈΠΌ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ ΠΏΡ€ΠΈΠΎΡ€ΠΈΡ‚Π΅Ρ‚Π½Ρ‹ΠΌΠΈ большоС количСство ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ…, каТдая ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΈΠΌΠ΅Π΅Ρ‚ нСбольшой эффСкт. Если Π² ΠΌΠΎΠ΄Π΅Π»ΠΈ трСбуСтся ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°Ρ‚ΡŒ нСсколько ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ…, каТдая ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΈΠΌΠ΅Π΅Ρ‚ срСдний ΠΈΠ»ΠΈ большой эффСкт, Π»ΡƒΡ‡ΡˆΠΈΠΌ Π²Ρ‹Π±ΠΎΡ€ΠΎΠΌ Π±ΡƒΠ΄Π΅Ρ‚ лассо.

РСализация. Π“Ρ€Π΅Π±Π½Π΅Π²ΡƒΡŽ Ρ€Π΅Π³Ρ€Π΅ΡΡΠΈΡŽ Π² sklearn ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ (см. Π½ΠΈΠΆΠ΅). Как ΠΈ для рСгрСссии лассо, Π² sklearn Π΅ΡΡ‚ΡŒ рСализация для пСрСкрСстной ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ Π²Ρ‹Π±ΠΎΡ€Π° Π»ΡƒΡ‡ΡˆΠΈΡ… ΠΈΠ· ΠΌΠ½ΠΎΠ³ΠΈΡ… ΠΎΠ±ΡƒΡ‡Π΅Π½Π½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Π”ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ ΠΊΠΎΠΌΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΠΉ

Π’Π°Ρˆ адрСс email Π½Π΅ Π±ΡƒΠ΄Π΅Ρ‚ ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½. ΠžΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ поля ΠΏΠΎΠΌΠ΅Ρ‡Π΅Π½Ρ‹ *