πŸ–Ό ΠšΠΈΡ‚Π°ΠΉΡΠΊΠΈΠ΅ ΡƒΡ‡Π΅Π½Ρ‹Π΅ Π΄ΠΎΠΊΠ°Π·Π°Π»ΠΈ ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ ИИ-систСм ΠΊ ΡΠ°ΠΌΠΎΠ²ΠΎΡΠΏΡ€ΠΎΠΈΠ·Π²Π΅Π΄Π΅Π½ΠΈΡŽ ΠšΠΈΡ‚Π°ΠΉΡ…

ΠšΠΈΡ‚Π°ΠΉΡΠΊΠΈΠ΅ ΡƒΡ‡Π΅Π½Ρ‹Π΅ Π΄ΠΎΠΊΠ°Π·Π°Π»ΠΈ ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ ИИ-систСм ΠΊ ΡΠ°ΠΌΠΎΠ²ΠΎΡΠΏΡ€ΠΎΠΈΠ·Π²Π΅Π΄Π΅Π½ΠΈΡŽ

ΠšΠΈΡ‚Π°ΠΉΡΠΊΠΈΠ΅ ΡƒΡ‡Π΅Π½Ρ‹Π΅ ΠΈΠ· Π€ΡƒΠ΄Π°Π½ΡŒΡΠΊΠΎΠ³ΠΎ унивСрситСта Π΄ΠΎΠΊΠ°Π·Π°Π»ΠΈ, Ρ‡Ρ‚ΠΎ искусствСнный ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚ с ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚Ρ‹ΠΌ исходным ΠΊΠΎΠ΄ΠΎΠΌ способСн ΡƒΡΠΏΠ΅ΡˆΠ½ΠΎ ΠΊΠ»ΠΎΠ½ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ сСбя.

ИсслСдованиС ΠΏΡ€ΠΎΠ²ΠΎΠ΄ΠΈΠ»ΠΎΡΡŒ Π½Π° ИИ-модСлях Π½Π° Π±Π°Π·Π΅ Llama ΠΎΡ‚ Meta (ΠΏΡ€ΠΈΠ·Π½Π°Π½Π° экстрСмистской ΠΎΡ€Π³Π°Π½ΠΈΠ·Π°Ρ†ΠΈΠ΅ΠΉ ΠΈ Π·Π°ΠΏΡ€Π΅Ρ‰Π΅Π½Π° Π² Π Π€) ΠΈ Qwen ΠΎΡ‚ Alibaba. Π£Ρ‡Π΅Π½Ρ‹Π΅ настроили ΠΌΠΎΠ΄Π΅Π»ΠΈ Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ½ΠΈ ΠΌΠΎΠ³Π»ΠΈ Π°Π²Ρ‚ΠΎΠ½ΠΎΠΌΠ½ΠΎ Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ многоэтапный ΠΏΠ»Π°Π½ Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π½Π° основС Ρ‚Π΅ΠΊΡƒΡ‰ΠΈΡ… наблюдСний. Π’ дСсяти испытаниях ИИ ΡƒΡΠΏΠ΅ΡˆΠ½ΠΎ ΠΊΠ»ΠΎΠ½ΠΈΡ€ΠΎΠ²Π°Π»ΠΈ сСбя: Llama β€” Π² 50% случаСв, Π° Qwen β€” Π² 90% случаСв.

Π˜ΡΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΠΈ ΠΎΡ‚ΠΌΠ΅Ρ‡Π°ΡŽΡ‚, Ρ‡Ρ‚ΠΎ это ΠΏΠΎΡ‚Π΅Π½Ρ†ΠΈΠ°Π»ΡŒΠ½Π°Ρ ΡƒΠ³Ρ€ΠΎΠ·Π° для контроля Π½Π°Π΄ ИИ. ΠšΡ€ΡƒΠΏΠ½Π΅ΠΉΡˆΠΈΠ΅ ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈ Π² области ИИ: OpenAI, Google ΠΈ Anthropic β€” относят самовоспроизвСдСниС ИИ ΠΊ списку ΡΠ΅Ρ€ΡŒΠ΅Π·Π½Ρ‹Ρ… рисков.

❀️ Новости ΠšΠΈΡ‚Π°Ρ | Π­ΠšΠ”


Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ: t.me