Kredit:Alvin Lee
I U.S. Securities and Exchange Commission (SEC) 10-K årsrapport for dets regnskabsår, der slutter 31. juli, 2008, Den amerikanske smykkeforhandler Zale Corporation (»Zales«) nævnte ordene »reklame« eller »reklame« 17 gange. Et år senere, de samme ord dukkede op mere end dobbelt så ofte ved 41 gange.
Inden da SEC havde påbegyndt undersøgelser, efter at selskabet forsinkede offentliggørelsen af resultaterne for fjerde kvartal. Zales blev efterfølgende fundet at have uretmæssigt aktiveret tv-reklameomkostninger fra 2004 til 2009, selvom få havde bemærket, hvad der foregik.
I en metode, der er omtalt i ny forskning af SMU Assistant Professor of Accounting Richard Crowley, denne bevidste fejlrapportering ville have fået alarmklokkerne til at ringe længe før SEC begyndte at stille spørgsmål.
"De er 97. percentil eller højere i vores model hvert eneste år fra det andet år med fejlrapportering og fremefter, " siger professor Crowley, med henvisning til maskinlæringsteknikken omtalt i papiret "Hvad siger du? Brug af emne til at opdage økonomisk fejlrapportering". "97. percentil her betyder, at deres score på vores fejlrapporteringsdetektionsmodel var højere end 97 procent af amerikanske offentlige virksomheder."
Han tilføjer:"Modellen køres årligt, så det betyder, at for hvert år i 2005, 2006, ... 2009, Zales opnåede en højere fejlrapportering detektionsscore end 97 procent af offentlige virksomheder det år."
Hvad er ordet?
Professor Crowley forklarer, at forskningen fuldstændig ignorerer tallene - "Hvis ledere vil fejlrapportere tallene, de kommer til at gøre det på en troværdig måde" - og ser i stedet på, hvad der står skrevet, som forskningen omtaler som 'emnet'.
Sammen med professorerne Nerissa Brown og Brooke Elliott fra Gies College of Business ved University of Illinois Urbana-Champaign, Professor Crowley analyserede over 3 milliarder ord i 10-K arkiver fra 1994-2012 for at se, hvor pålideligt visse emner forudsagde bevidst fejlrapportering. I visse prøver, forskningen forbedrede forudsigelsen af bevidst fejlrapportering med 59 procent.
"Den vigtigste forskel, når du diskuterer ting, når du lyver, er, at du er meget bevidst om de emner, du vælger at diskutere, " uddyber han, peger på eksemplet med Enron.
"De taler bare om stigninger i indkomst, og de har en enorm diskussion om det, " bemærker professor Crowley. Enrons årsrapport for 1999 tjener som et godt eksempel, citerer "acceleration af Enrons svimlende tempo i kommerciel innovation" for en 28 procents omsætningsstigning til 40 milliarder USD fra et år siden, samt et hop på 37 procent i nettoindtægt før engangsposter til 957 millioner USD.
Professor Crowley fremhæver en sætning, som Enron ofte brugte i deres 10-K'er:"sammenlignet med". Han forklarer:
"Virksomheder siger altid ting som, 'Dette er vores indkomst i 2011 sammenlignet med indkomsten i 2010, ' og de giver altid prognoser om indkomst, bruttoavance mv.
"Men så har du indkomstskatter, ikke-renteindtægter, profit, det er bare de generelle sætninger, der dukker op. Da vi valgte de mest repræsentative sætninger for hvert af disse emner, vi fandt sætninger som 'driftsoverskuddet var $122,1 millioner i 2011 sammenlignet med $113,9 millioner til 2010, en stigning på 7,8 procent.' Dette er en meget almindelig struktur at se i disse dokumenter.
"Så når vi taler om Enron, de har sådanne sætninger, men de har meget flere af dem end nogen anden nogensinde har gjort, både i 1999 og gennem hele vores prøves historie."
I betragtning af det påståede antal aftaler, som Enron havde, der genererede al den indtjening, det kunne være mere fornuftigt at læse i sine årsrapporter ting som at anskaffe kilder til sine energikontrakter, Professor Crowley bemærker. I stedet, det talte stort set om indtægtstal og indkomsttal, observerer han.
Så er der et vendepunkt for antallet af gange et emne dukker op, som er et rødt flag? Eller den slags ord, der bruges?
"Der er ingen konstant slags barometer for dette, " Professor Crowley fortæller Office of Research and Tech Transfer. "Jeg kan ikke bare sige, om de talte om det X procent af tiden, vi fik dem. Det afhænger af en masse faktorer. Og mange af disse faktorer er branchespecifikke, og nogle er firmaspecifikke.
"[Det afhænger også af, om] du er i en recession versus hvis du ikke er i en recession. Ligeledes hvis du er en finansiel virksomhed versus en sundhedsvirksomhed, eller et telefonselskab kontra en stålproducent, [emnerne at kigge efter] burde alle være forskellige."
Du kan ikke spille det, du ikke ved
Professor Crowley og hans samarbejdspartnere brugte over 20 forskellige tekstbaserede variabler i deres prædiktive model, herunder brugen af tågeindekset for læsbarhed.
Selvom intuition ville foreslå en letlæselig 10-K for at være gennemsigtig, Professor Crowley imødegår med at sige "det kan være fordi de har udeladt alle detaljer". Tilsvarende positive følelser som dem, Enron udtrykte, kunne være signaler på bevidst fejlrapportering, selvom det er umuligt at være 100 procent sikker.
"Det tager kun seks sekunder at køre gennem en 10-K med vores model, " siger professor Crowley, mens han bemærker, at SEC har overtaget dele af hans model for at afsløre bevidst fejlrapportering. Men spørgsmålet må stilles:Kan virksomheder, der ønsker at vildlede markedet, studere algoritmen for at slå SEC i deres eget spil?
"Den ene gode ting ved denne algoritme er, at den ændrer sig hvert år, " uddyber han, peger på den kombination af ord, der udgør de emner, som algoritmen arbejder på. "Virksomheder ved ikke, hvad regulatorens mål ville være, selvom de bruger vores algoritme."
"Fordelen ved det er, at hvis du er en virksomhed, der forsøger at manipulere, du ved heller ikke, hvad målet er."
Sidste artikelOpdaterede juridiske kort viser marginale ændringer i amerikanske statslige boliglove
Næste artikelThe BNP fudge:China-udgave