Jak ustalić, że tekst został napisany przez sieć neuronową
Miscellanea / / August 21, 2023
Sztuczna inteligencja jest dobrym pomocnikiem w wielu dziedzinach. Ale nie powinieneś ufać mu bezwarunkowo.
Przez dane Bloomberg około 30% specjalistów wykorzystuje sieci neuronowe do generowania tekstu. W Rosji 67% respondentów chcesz aplikować w pracy sztucznej inteligencji, żeby mniej pracować i nie tracić dochodów. To tylko takie statystyki podobają się nie wszystkim klientom. Niektórzy nie ufają sieciom neuronowym, więc wolą, żeby teksty nie były pisane przez roboty, ale przez ludzi.
Rozumiemy, dlaczego klienci obawiają się technologii i jakie istnieją obecnie sposoby ujawniania neurotekstów.
Dlaczego teksty z sieci neuronowych należy traktować z ostrożnością
Oto główne powody, dla których klienci obawiają się takich artykułów.
Ryzyko naruszenia praw autorskich
Dziś nie ma oficjalnego stanowiska w kwestii kto przynależeć prawa autorskie do tekstów tworzonych przy pomocy AI. Zgodnie z ustawą twórcą jest osoba, która tworzy utwór pracą twórczą lub intelektualną. Jednak w przypadku sieć neuronowa ludzie tylko dają instrukcje, ale sami nie piszą.
Ponieważ obecnie prawo nie uznaje neurotekstów za przedmiot praw autorskich, zasady korzystania z treści generowanych przez technologie określa umowa użytkownika sieci neuronowej.
A jeśli Open AI transmituje prawa do tekstu nawet w darmowej wersji, to Gerwin granice jego wykorzystania w celach politycznych, dyskryminacyjnych lub w niekorzystnej reklamie. I w w połowie podróży wykorzystywać treści do celów komercyjnych Móc tylko wtedy, gdy produkt jest generowany po opłaconej stawce.
Ryzyko uzyskania nieunikalnych lub niedokładnych informacji
Sieć neuronowa otrzymuje żądanie, przepuszcza je przez algorytmy, analizuje dostępne informacje na dany temat i wydaje odpowiedź. Nie zaprzeczając, że to samo żądanie innego użytkownika może spowodować powstanie podobnego lub podobnego tekstu.
I tu pojawia się nowe niebezpieczeństwo. Wymyślili to naukowcy z Cornell University wniosek: jeśli odpowiedzi sieci neuronowej na to samo pytanie bardzo się różnią, to z dużym prawdopodobieństwem dochodzi do faktów.
Ryzyko, że neuroteksty obniżą zasób firmy w wynikach wyszukiwania
Pod koniec ubiegłego roku specjalista ds. jakości w Google, Duy Nguyen zdeklarowanyże firma posiada algorytmy wykrywające i obniżające jakość tworzonych treści sztuczna inteligencja. Dlatego wielu obawia się, że wyszukiwarki będą szukać takich treści i pesymizować je. Czyli obniżyć pozycję w wynikach wyszukiwania.
Precedensy już istnieją. Na przykład marketingowiec Neil Patel wydał eksperymenttworząc 50 serwisów testowych, które podzielił na dwie grupy. Ekspert wypełnił strony pierwszej części artykułami tworzonymi wyłącznie przez sztuczną inteligencję. Strony z drugimi hostowanymi artykułami AI modyfikowanymi przez ludzi, a także materiałami pisanymi przez copywriterów bez użycia sieci neuronowych.
Wyniki eksperymentu pokazały, że zasoby pierwszej grupy straciły kilka pozycji w wynikach wyszukiwania. I doprowadziło do zmniejszenie ruch do 70%.
Jednocześnie przedstawiciele Google dodali, że są pozytywnie nastawieni do rozwoju sieci neuronowych i stworzyli już własne Chatbot Bard. Ale dla firmy jakość tekstów jest priorytetem. System oceniający wyniki przede wszystkim oferuje użytkownikom materiały spełniające ich wymagania standardy E-E-A-T (doświadczenie, kompetencje, wiarygodność, wiarygodność).
Odpowiadające im teksty budzą zaufanie i są uważane za przydatne, ponieważ zawierają przykłady, doświadczenie, część analityczną i badania. A treść, którą tworzą sieci neuronowe, bez dodatkowego głębokiego udoskonalenia przez osobę, często taka nie jest.
Tymczasem w Dumie Państwowej zasugerował wprowadzić etykietowanie materiałów tworzonych przy pomocy AI. Dopóki tak się nie stanie, ustal, że text generowane przez sieć neuronową, będzie musiał zrobić to sam. Lub przy pomocy służb specjalnych.
Jak samodzielnie ustalić, że tekst został napisany przez sieć neuronową
Niedawno odbył się Uniwersytet Technologiczny MIREA eksperyment, w którym wzięło udział 20 nauczycieli i ponad 200 uczniów. Połowa z nich samodzielnie pisała prace naukowe. A pozostałe 50% korzystało z pomocy sieci neuronowych. Nauczyciele natomiast musieli obliczać takie materiały AI.
W tym celu nauczyciele zwracali uwagę na cechy stylistyczne i ortograficzne tekstu. Na przykład dla dużej liczby powtarzających się słów i znaczeń, rzeczywistych i logicznych błędy, brak oryginalnych orzeczeń. W ten sposób nauczyciele byli w stanie zidentyfikować 96% prac napisanych za pomocą sieci neuronowej. 4% uczniów, którzy nie byli narażeni, przyznało, że spędziło wiele godzin na redagowaniu tekstu AI.
Nie ma uniwersalnej instrukcji, która pomoże obliczyć tekst generowany przez sieć neuronową. Eksperyment pokazuje jednak, że podobne wzory są nieodłącznie związane z takimi materiałami. Rozważmy je bardziej szczegółowo.
Powtórzenia znaczeń i słów
Jednym z powodów, dla których strona spada w wynikach wyszukiwania, jest ponowna optymalizacja słów kluczowych. Sieć neuronowa w odpowiedzi na żądanie często „odpowiada w kółko”. Czasami używa różnych wystąpień, ale znaczenie wciąż się powtarza.
Tak więc na poniższym zrzucie ekranu sztuczna inteligencja otrzymała zadanie napisania posta sprzedażowego o nowym, delikatnym sposobie farbowania włosów. A w małym tekście sieć neuronowa wielokrotnie powtarzała te same tezy.
Prawie każde zdanie wygenerowany tekst powtarza się zwrot „nowy sposób barwienia”. A także powtarzające się powielanie znaczeń o bezpieczeństwie metody i indywidualnym podejściu, które podkreśli wyjątkowość każdego klienta.
Ilustrują to cytaty z tekstu: „przekształć swój wizerunek i wyraź swoją indywidualność”, „uwzględnij swoją indywidualność”, „odpowiedni dla Ciebie”, „stwórz dla siebie niepowtarzalny i stylowy wygląd”, „uczyń swoją fryzurę wyjątkową”, „zachowaj zdrowie i blask włosów”, „bezpieczne dla włosów”, „pielęgnuj włosy, konserwując je zdrowie".
Tymczasem wystarczyło raz wspomnieć, że w salonie zaprezentowano nowy zabieg - oszczędny metoda barwieniaktóry utrzyma włosy przy życiu. A także wyjaśnij, jak działa metoda, na czym polega jej nowość i dlaczego jest bezpieczna. I dodaj, że paleta kolorów jest różnorodna, a przeszkoleni mistrzowie nie tylko przeprowadzą barwienie z wysoką jakością, ale także pomogą w wyborze koloru.
Obecność w tekście dużej liczby znaczków i klisz, brak doznań zmysłowych
Przykład kolorowania pokazuje również, że sieć neuronowa nie może naśladować sposobu, w jaki osoba mówi w prawdziwym życiu. Ludzie zamknijcie się, używajcie gwara i skróty, celowo zniekształcają słowa. Taka prezentacja pomaga przykuć uwagę, wywołać emocje, przekazać stanowisko autora, jego doznania zmysłowe.
Badania pokaż: sieć neuronowa nie podziela uczuć, nie akceptuje niczyjego stanowiska. Dlatego preferuje neutralność, klisze i klisze. W powyższym przykładzie są to „umiejętności zawodowe”, „wysokiej jakości materiały”, „wyjątkowa okazja”.
Jednocześnie sieć neuronowa generuje teksty w różnych stylach. Na przykład możesz zlecić jej przygotowanie materiału na temat „Co wpływa na koszt olej». Ale żeby wyjaśnić, że tekst nie powinien być napisany suchym językiem, ale z dodatkiem metafor i porównań. Jednak wynik jest nadal sztuczny. W końcu AI nie ma miary, nie „czuje” tekstu tak, jak człowiek.
1 / 0
2 / 0
Jeden z akapitów pomoże zobaczyć, że uzyskanego wyniku nie można porównać z intonacją właściwą osobie: „Popyt i podaż są jak taniec dwojga kochanków na rynku ropy. Jeśli zapotrzebowanie na ropę rośnie jak szalejący ocean, a jeśli podaż nie nadąża, ceny rosną jak szampan na imprezie sylwestrowej. Ale jeśli popyt spada, a podaż rośnie, ceny mogą spaść jak balon na przyjęciu dla dzieci”.
Tekst wydaje się sztuczny, a większość zwrotów jest nie na miejscu. I choć post rzeczywiście okazał się „nie suchy”, to trudno sobie wyobrazić, że ekspert napisałby w ten sposób. Poza tym dosłownie każde zdanie jest metaforą i porównaniem. Jednak takie techniki powinny być precyzyjne i starannie osadzone w tekście. W przeciwnym razie znaczenie zostanie utracone za nadmiarem obrazów.
Obecność bezsensownych fraz i brak logiki
Językoznawca Noam Chomsky w swojej książce Struktury syntaktyczne zauważa, że poprawna gramatycznie budowa fraz w zdaniu nie gwarantuje obecności logika i znaczenie. Jako przykład ekspert podał frazę bezbarwne zielone idee śpią wściekle - „bezbarwne zielone idee śpią wściekle”.
Algorytmy pomagają sieci neuronowej budować zdania poprawne pod względem gramatycznym. Jednak w przypadku sztucznej inteligencji nie ma pojęcia „znaczenia”. I może mieć własną logikę dla każdego akapitu, ponieważ materiał pochodzi z różnych źródeł.
Na przykład poproszono sieć neuronową o wygenerowanie recenzji żelu pod prysznic i dresu. Tekst o ubraniach wyglądał tak: „Z pomocą garnituru możesz się zrelaksować, zanurzyć w świat sportu, a także wybrać się na spacer. Posiada regulację temperatury, dzięki czemu poczujesz się komfortowo w każdej sytuacji.
A tu recenzja żelu pod prysznic: „Cudowny żel, nie cieknie, nie obciąża skóry. Zapakowany w woreczek, w pudełko, z wieczkiem. Nie trzeba czekać na nic więcej, żeby trochę się pokruszyło. Może być stosowany jako żel pod prysznic na noc.
Niektóre zwroty w nich dobrze zbudowany, ale jednocześnie wydają się absurdalne i przypominają ilustrację Chomsky'ego.
Brak tekstury i powierzchownych przykładów
Sztuczna inteligencja podaje w tekstach oczywiste informacje, ogólne fakty, używa uproszczonych zwrotów i przykładów, które niewiele wyjaśniają pytanie. W tym przypadku złożoność tematu nie ma znaczenia. Pytanie może być głębokie, na przykład perspektywy rozwoju inkluzje w Rosji. Lub bardziej proste i indywidualne, dotyczące wyboru techniki.
W tekście o inkluzji sieć neuronowa opowiadała, jak ważny i aktualny jest to temat. Dodała też, że inkluzja to długi proces, któremu towarzyszą trudności, ale trwają prace nad stworzeniem warunków dla osób ze specjalnymi potrzebami. I podsumowując: jeśli nie przestaniesz, to rozwój na pewno będzie.
Jednak to, co jest napisane, nie odpowiada na pytanie. Ważne jest, aby tekst był konkretny. Można na przykład przeanalizować, które z przyjętych przepisów działają, a które nie i dlaczego. Aby ujawnić zagraniczne doświadczenia. I wyjaśnij, jakie konkretne kroki państwo, biznes i każda osoba może jeszcze podjąć, aby rozwijać integrację.
W tekście o zakup smartfonagenerowanych przez sieć neuronową, wskazane są również oczywiste czynniki selekcyjne. Na przykład: należy zdecydować się na system operacyjny (iOS lub Android), markę, przeczytać recenzje i specyfikacje techniczne, a także wziąć pod uwagę własne możliwości.
1 / 0
2 / 0
Jednak ludzie to rozumieją. Inną rzeczą jest rozmowa o chipach systemów operacyjnych, aby wskazać ograniczenia, które istnieją w tej chwili. Albo wspomnij o nowatorskich rozwiązaniach – na przykład o technologii eSIM, która pozwala mieć aż pięć numerów w jednym smartfonie. Lub udostępniaj przecenione modele urządzeń i ich odpowiedniki w najlepszej cenie.
Przeinaczanie faktów, dodawanie zmyślonych informacji
Sieć neuronowa wiarygodnie odpowiada na prawie każde pytanie, dostarczając kronikę, daty, nazwiska, historię pochodzenia. W takim przypadku informacja jest zniekształcona lub całkowicie wymyślona. Taki błąd w działaniu AI nazywa się halucynacją.
Tak więc sieć neuronowa otrzymała zadanie opowiadania o słynnych głusi ludziektóry wniósł wielki wkład w rozwój społeczeństwa. W rezultacie większość z nich wymyśliła sztuczna inteligencja.
1 / 0
2 / 0
Na przykład astronauta Raymond Lou lub bokser Mario Gallegos. A 42. prezydentem Stanów Zjednoczonych nadal nie był Matthew Clinton, ale Bill Clinton. I nie stracił słuchu.
Ponadto AI z pewnością odpowiedziała na prośbę „napisz post o kreacji amnezja». Chociaż nie ma takiego terminu.
Zapytany, dlaczego bot wymyśla ludzi i mówi o nieistniejących pojęciach, przeprasza jedynie za ewentualne zamieszanie.
1 / 0
2 / 0
Kiedy fałszywe fakty przeplatają się z prawdziwymi danymi, trudniej jest wykryć halucynacje sieci neuronowej. Zwłaszcza gdy płynne czytanie. Ale jeśli skoncentrujesz się na przykładach podanych w tekście, możesz zauważyć te, które wyglądają podejrzanie i sprawdzić je, wpisując je w pasku wyszukiwania.
Brak aktualnych informacji o bieżących zmianach, wydarzeniach
Sieci neuronowe uczą się samoczynnie podczas komunikacji z użytkownikami, zapamiętując wyjaśnienia osoby, jej reakcję na wygenerowaną treść, przykłady, którymi dana osoba dzieli się z botem. Eksperci odnotowanyże zdolność sztucznej inteligencji do samouczenia się była dla nich zaskoczeniem. I że ta umiejętność pomaga ulepszać sieci neuronowe.
W której nauczanie maszynoweprowadzona przez programistów na gigabajtach danych – artykułach, książkach, tekstach z Sieci – ma wyraźny początek i koniec. I w zasadzie sieci neuronowe nie mają dostępu do wyszukiwarek. W związku z tym informacje, które pojawiły się po przeprowadzonym przez twórców szkoleniu, nie są dostępne dla AI aż do następnego etapu.
Jednocześnie odstęp między uczeniem maszynowym to miesiące, a czasem lata. Oczywiście postęp nie stoi w miejscu: na przykład w maju tego roku GPT Plus stał się dostępny dla użytkowników z opłaconą subskrypcją ChatGPT z dostępem do Internetu. Jednak większość sieci neuronowych, zwłaszcza ich darmowe wersje, nie ma jeszcze takiej możliwości.
Tak więc baza darmowej wersji ChatGPT4 jest ograniczona do 2021 roku, więc bot nie wie, kto wygrał ostatni Puchar Świata w 2022 roku. A sieć neuronowa Google – Bard AI – przyznała, że nie potrafi ułożyć tekstu o znaczących wydarzeniach, które miały miejsce na świecie tego lata.
1 / 0
2 / 0
Ponieważ jej ostatnie szkolenie zostało przeprowadzone przez twórców w maju 2023 roku, lato dla Bard AI jeszcze nie nadeszło.
W takich przypadkach sieci neuronowe zwykle nie wymyślają faktów, ale przyznają, że nie mogą "przewidzieć przyszłość».
Jeśli tekst nie zawiera aktualnych informacji na dany temat lub wygląda na oderwany od rzeczywistości, bo ostatnio wiele się zmieniło, to istnieje możliwość, że materiał został napisany przez sieć neuronową.
Jakie usługi mogą pomóc
Tekst generowany przez sztuczną inteligencję można również rozpoznać za pomocą samej sieci neuronowej. Na przykład może nerw GPT-4. Pomocne mogą być również usługi specjalne, które potrafią wykrywać algorytmy sztucznej inteligencji. Przyjrzyjmy się niektórym z nich poniżej.
- Text.ru. Strona pozycjonowana jest jako giełda copywritingowa i antyplagiatowa. Ale ostatnio na portalu pojawił się płatny neuroasystent. Jedną z jego funkcji jest detektor AI. Tekst do sprawdzenia powinien zostać załadowany do okna. Po kilku sekundach system poda wynik.
- PR CY. Do serwisu możesz przesyłać teksty o długości od 1000 znaków. Jednocześnie na portalu pojawiają się wyjaśnienia: niskiej jakości, spamowane opcje, które napisała osoba, system uzna za efekt pracy AI. A także teksty o jasnej kolorystyce stylistycznej - na przykład podobne do prac Majakowski.
- GPTZero. Narzędzie odczytuje złożoność, kombinację słów, strukturę i długość zdań. Jeśli jednak serwis dobrze radzi sobie z tekstami w języku angielskim, to przy ładowaniu materiałów w języku rosyjskim często wywala błąd. Z korzyści - obecność darmowej wersji.
Sieć neuronowa może być świetnym pomocnikiem. Na przykład podczas szukania pomysłów. Jednak całkowite zaufanie do jej treści jest niebezpieczne. Powinieneś traktować materiały AI odpowiedzialnie: edytuj spam, sprawdzaj dokładność, logikę i trafność faktów. I dostosuj styl do „ludzkiego” języka, aby nie straszyć odbiorców, ratować reputację i pozycję firmy w wynikach wyszukiwania.
Przeczytaj także🤖
- 6 powodów, dla których nie powinieneś ślepo ufać sztucznej inteligencji
- Jak dodać bota do Discord
- 6 sieci neuronowych do tworzenia logo