Umræðan

Þegar mælingin blindar

Eyþór Ívar Jónsson skrifar

Ég veit ekki hve oft ég hef heyrt fólk vitna í stjórnunarráðgjafann Peter Drucker í ræðu og riti og segja: „If you can’t measure it, you can’t manage it“ – ef þú getur ekki mælt það, getur þú ekki stýrt því! Tilvitnunin á að undirstrika mikilvægi þess að reyna að mæla sem flest í rekstrinum til þess að geta stýrt honum almennilega. Þetta hljómar vel. Það er þó algengur misskilningur, og hugsanlega gildra sem Google eða chatGPT leit gæti leitt fólk í, að Drucker hafi sagt þetta. Svo er ekki raunin, eftir því sem best er vitað. Einu sinni benti ég ræðumanni á þetta og þá sagði hann að það kynni að vera rétt en Drucker hefði örugglega haldið þessu fram þó að þetta væri ekki orðrétt tilvitnun. Það er heldur ekki rétt!

Nú er rétt að útskýra fyrir þeim sem þekkja ekki til Peters Druckers að hann skrifað mikið um stjórnun og stefnumótun á tuttugustu öldinni, 39 bækur og fjöldann allan af ritgerðum og blaðagreinum. Hann var einn áhrifamesti stjórnunargúru síns tíma. Drucker var m.a. mikill áhugamaður um stjórnun með markmiðum (Management by Objectives) og oft nefndur sem upphafsmaður þeirrar hugmyndafræði. Sú hugmyndafræði hefur þróast og er sennilega best þekkt í dag sem OKR – Objectives & Key Results. Það snýst um að setja markmið sem styðja við meginmarkmið fyrirtækja og finna viðeigandi mælikvarða til þess að fylgjast með hvort verið er að ná markmiðum eða ekki.

Það sem Drucker varaði hins vegar við, sem virðist að einhverju leyti hafa gleymst, er að það er alltaf hætta á að mælingarnar fari að stýra raunveruleikanum, þ.e. við einblínum á það sem við getum mælt en ekki það sem skiptir máli. Þetta hljómar kannski eins og það skipti litlu máli þegar mikilvægast er að beita málbandinu til að ná árangri. En þetta gæti verið alvarlegra mál en flestir átta sig á.

Árangursstjórnun án árangurs

Sumir fræðimenn vilja tengja saman umræðuna um árangursstjórnun og áhersluna á mælikvarða. Það er hægt rekja upphaf árangursstjórnunar með mismunandi hætti en oft er vitnað í bók þeirra Tom Peters og Robert H. Waterman Jr. In Search of Excellence (1982). Án þess að fara mikið ofan í þá umræðu er það ekki fjarstæðukennd tilgáta að gríðarlegar vinsældir bókarinnar hafi komið hugmyndum um lykilmælikvarða (KPIs) á kortið og eftir það var enginn stjórnandi almennilegur stjórnandi nema að hafa lykilmælikvarðana á hreinu. Það er í sjálfu sér gott framtak en ekki svarið við öllu. Og vandamálin verða til þegar ekki er verið að mæla réttu hlutina eða að mælikvarðarnir búa til blindan blett (blindspot).

Það sem Drucker varaði hins vegar við, sem virðist að einhverju leyti hafa gleymst, er að það er alltaf hætta á að mælingarnar fari að stýra raunveruleikanum.

Peters og Waterman vöruðu hins vegar við því í bókinni að það væri hættulegt að festast í tölulegum mælikvörðum. Of mikil áhersla á mælikvarða gæti leitt til þess að stjórnendur fyrirtækja missi sjónar af mikilvægum þáttum eins og nýsköpun og þjónustu við viðskiptavini. Tom Peters fjallaði um þetta líka í seinni bókum sínum þar sem of mikill fókus á mælingar gæti leitt til þess að fyrirtæki tapi sveigjanleika og hæfni til þess að aðlagast breytingum. Hann varaði einnig við því að rangir mælikvarðar gætu leitt til óæskilegrar hegðunar ef þeir væru ekki rétt hannaðir eða tækju t.d. ekki tillit til mannlegra þátta. Sagan af Enron í Bandaríkjunum ætti að gefa vísbendingu um að stundum geta mælikvarðarnir leitt til mjög óæskilegrar hegðunar. Á einum tímapunkti var fyrirtækið leiðandi í að búa til orkukreppu í Kaliforníu (2000 – 2001). Þar tókst starfsmönnum félagsins að hámarka eigin ávinning og hagnað félagsins á kostnað almennings. Félagið sigldi sér svo sjálft í gjaldþrot með því að falsa eigin mælikvarða.

Tom Peters fjallaði mikið um sveigjanleika fyrirtækja í síðari bókum sínum og áhersluna á stöðugar breytingar og umbætur. Hugmyndir hans hafa líka verið túlkaðar þannig að við þurfum að skilja hvað er árangur til þess að geta verið í árangursstjórnun. Vitlausir mælikvaðar á árangur, af því að við höfum ekki velt því fyrir okkur hvað er árangur og fyrir hvern, geta frekar gert ógagn en gagn. Hefðbundnir bókhaldsmælikvarðar eru t.d. ekki alltaf bestu mælikvarðar á árangur fyrirtækja eða góð undirstaða stefnumótunar til framtíðar.

Peter Drucker var fyrstur, um miðja síðustu öld, til þess að sjá að þróun hagkerfisins myndi leiða til þess að þekkingarstarfsmaðurinn yrði æ mikilvægari og að við myndum þróast í þekkingarhagkerfi.



Það er áhugaverð þversögn að bók þeirra Peters og Waterman, In Search of Excellence, hafi ýtt undir stjórnun með mælikvörðum þegar bókin var skrifuð til að gagnrýna þá aðferðafræði. Peters og Waterman voru einmitt að vara við tölfræðilegri nálgun og vildu auka áherslu stjórnenda á menningu og fólk. En það hefur einhvern veginn týnst í sögunni.

Nýsköpun og hagfræðileg blindni

Við erum sennilega tilbúin að sjá í gegnum fingur okkar í rekstrarlegu samhengi en vandamálið við blekkingun tölfræðinnar getur magnast upp þegar við förum að tala um heilu hagkerfin.

Við sem höfum talað fyrir nýsköpun og frumkvæði höfum verið óþreytt að benda á að lengst af og að mörgu leyti enn þá var nýsköpun og frumkvöðullinn ekki hluti af hefðbundinni hagfræðiumræðu. Þau voru ytri þættir eins og veðurfar í hagfræðilegri umræðu. Mælikvarðar hagfræðinnar voru framboðs- og eftirspurnarlíkön. Síðar var það peningamagnsjafnan. Austurrískir hagfræðingar voru ekki jafn áhugasamir um tölfræðilega og raunvísindanálgun nýklassískrar hagfræði. Þar kemur sennilega útskýring á skoðunum Peter Druckers, sem var fæddur í Austurríki, en þó að hann sé ekki talinn upp meðal austurrísku hagfræðinganna þá var vantrú hans á að mælikvarðar væri lausn allra vandamála hin sama.

Ég er enn að hitta hagfræðinga sem tala um hagfræði eins og raunvísindi og telja að austurríska nálgunin á hagfræði sé della. Það eru líka þeir hinir sömu og skilja illa að nýsköpun, tækniframfarir eða að ný og vaxandi fyrirtæki skipti máli fyrir hagkerfið.

Þó ótrúlega megi virðast þá voru frumkvöðullinn og smáfyrirtæki ekki áhugaverð í hagfræðilegri umræðu fyrr en í lok sjöunda áratugar síðustu aldar, þ.e. einungis fyrir fjörutíu og fimm árum síðan. Þá fjallaði m.a. David L. Birch um að stærstur hluti starfa í Bandaríkjunum yrði til í litlum og meðalstórum fyrirtækjum. Síðar fjallaði hann um „gasellur“ sem ört vaxandi fyrirtæki sem vakti athygli á mikilvægi nýsköpunar. Í seinni tíð er oftar talað um einhyrninga sem fyrirtæki sem vaxa ofur hratt. Ef við tryðum enn á að stórfyrirtæki skipti öllu máli og að framboðs- og eftirspurnarlíkön séu upphaf og endir verðmætasköpunar hefði blindi bletturinn verið á þeim fyrirtækjum sem eru að leiða framþróun tækni og nýsköpunar.

Flestir, þó ekki allir, sem fjalla um atvinnuuppbyggingu og hagþróun skilja mikilvægi nýsköpunar, frumkvöðla og lítilla og ört vaxandi fyrirtækja. Eftir að hagfræðingurinn Robert M. Solow fékk Nóbelsverðlaunin fyrir brautryðjendastarf í hagvaxtarkenningum eru æ fleiri sem samþykkja hugmyndir Solows frá 1956 um að tækniframfarir útskýri stærstan hluta hagvaxtar í Bandaríkjunum á tuttugustu öldinni. Tækniframfarir féllu undir ytri þætti í fyrri líkönum klassískrar hagfræði, rétt eins og veðrið.

Ég er enn að hitta hagfræðinga sem tala um hagfræði eins og raunvísindi og telja að austurríska nálgunin á hagfræði sé della. Það eru líka þeir hinir sömu og skilja illa að nýsköpun, tækniframfarir eða að ný og vaxandi fyrirtæki skipti máli fyrir hagkerfið. Það passar einfaldlega ekki inn í módelin og mælikvarðana. Ef við værum enn þar væri engin ástæða til að fjárfesta í tækni.

Þversögnin um framleiðni tækninnar

Ein frægasta tilvitnunin í Robert M. Solow er frá 1987 þegar hann sagði: “You can see the computer age everywhere but in the productivity statistics.” – tölvubyltingin er alls staðar nema í tölfræði um framleiðni. Þrátt fyrir mikla dreifingu tölva og upplýsingatækni (IT) í fyrirtækjum og samfélagi á áttunda og níunda áratugnum, þá sást engin marktæk framleiðni aukning í opinberum gögnum. Þetta var stundum kallað Solow-þversögnin.

Seinni tíma rannsóknir hafa síðan gefið vísbendingar um að þessi þversögn var einnig til staðar þegar fyrri tæknibyltingar höfðu breytt heiminum. Nokkrar skýringar hafa verið gefnar á þessu fyrirbæri. Meðal annars að tafir á innleiðingu tækninnar þar sem það tekur tíma að hagræða ferlum, menningu og færni eftir að ný tækni kemur til sögunnar. Tæknin getur bætt hag sumra fyrirtækja á kostnað annarra sem þýðir þá að nettó áhrifin eru minni en ella. Jafnvel hefur verið bent á að þó að tæknin sé til staðar þá er hún ekki nýtt til fulls í rekstri eða skipulagi. Þetta er allt áhugaverðar skýringar. Rannsóknir á áhrifum upplýsingatækninnar frá 1990 til 2000 sýndu að þær voru einungis mælanlegar þegar breyting á skipulagi, færni og verklagi fylgdi með. Þetta er grunnhugmynd kenningar um tækni til almennrar notkunar (General Purpose Technologies).

Verg landsframleiðsla (VLF) er leiðandi mælikvarði í efnahagslegu samhengi. Mælikvarðinn varð til upp úr kreppunni 1929 sem leið til þess að fanga betur þróun hagkerfa. Það er hægt að fjalla í löngu máli um af hverju þetta er gallaður mælikvarði á heilbrigði hagkerfa.


Þetta hefur líka verið áberandi í umræðunni um spunagreindina (Generative AI). Framleiðnin er ekki að koma fram þó að aldrei áður í sögu mannkynsins hafi ein tækni verið tekin til notkunar af jafnmörgum á jafnskömmum tíma. Það er enginn með í leik og starfi nema að nota chatGPT, Deepseek, Gemini eða aðra spunagreind til þess að gera allt eða ekkert. Skólar heimsins hafa sjaldan lent í viðlíka tilvistarkreppu þar sem kennarar eiga erfitt með að sjá hvernig er hægt að greina á milli þekkingu og getu nemenda og notkun tækninnar. Það verður aldrei hægt að horfa sömu augum á skólaheimaverkefni og áður. Forritarar nota tæknina til þess að hjálpa til við að framleiða kóða og markaðsfólkið er hætt að skrifa texta af því spunagreindin tengir betur við viðskiptavinina.

En samt er ekki alveg hægt að sjá framleiðnina í tölfræðinni.

Verg landsframleiðsla í þrot

Verg landsframleiðsla (VLF) er leiðandi mælikvarði í efnahagslegu samhengi. Mælikvarðinn varð til upp úr kreppunni 1929 sem leið til þess að fanga betur þróun hagkerfa. Það er hægt að fjalla í löngu máli um af hverju þetta er gallaður mælikvarði á heilbrigði hagkerfa. Þetta er í grunninn veltumælikvarði sem mælir endaleg verðmæti vara og þjónustu sem hagkerfi „framleiðir“. Ef það er ekki til verð á vöru eða þjónustuna þá mælist það ekki með. Segjum sem dæmi að þjóðfélag væri ríkt af sjálfboðaliðum, eins og Ísland, sem halda uppi björgunarsveitum, íþrótta- og kirkjustarfsemi landsins þá kemur það ekki fram í vergri landsframleiðslu og væri þar með einskis virði. En það er ekki hugmyndin að endurtaka hér ýmislegt sem aðrir hafa bent á í þessu samhengi eins og t.d. David Pilling í bókinni The Growth Delusion sem tók þessa umræðu lengra en flestir.

Það er hins vegar önnur áhugaverð gagnrýni sem er rétt að staldra við. Okkar maður Erik Brynjolfsson hefur verið að glíma við þversögnina hans Solows. Ég segi okkar maður vegna þess að Erik er Íslendingur í föðurætt, sonur Ara Brynjólfssonar eðlisfræðings sem er ættaður úr Hörgárdalnum. Af öðrum ólöstuðum er Erik Brynjolfsson fremstur á meðal jafningja þegar kemur að umfjöllun um tækni og hagfræði. Hann var lengi vel prófessor við MIT en er núna prófessor við Stanford háskólann. Það er ekki bara mitt mat. Martin Wolf, einn af helstu viðskiptablaðamönnum Financial Times, sagði að enginn hefði gert meira til þess útskýra áhrif tækninnar á hagþróun heimsins en Erik.

Erik hefur fjallað um það sem aðrir hafa vakið athygli á að mælikvarðinn sem við notum til þess að mæla framleiðni er einfaldlega ekki nógu góður. Mælikvarðinn sem notaður er til þess að meta framleiðni þjóða og heimshagkerfisins er verg landsframleiðsla deilt með vinnustundum. Verg landsframleiðsla tekur ekki tillit til óefnislegra þátta eins og gervigreindar, hugbúnaðar og stafrænnar þjónustu sem hefur verið drifkraftur framþróunar undanfarin ár og áratugi. Þannig hefur VLF ekki náð að fanga raunveruleg áhrif nýrrar tækni og stafrænnar þjónustu á hagkerfið.

Við höfum verið að reyna að mæla velsæld og hagvöxt með mælikvarða sem var hannaður fyrir verksmiðjur og vörubíla – ekki fyrir gagnaský og forrit.


Það er vissulega þægilegt að styðjast við verga landsframleiðslu sem mælikvarða á árangur og þróun. En vandamálið við VLF er ekki hvað hún segir — heldur hvað hún segir ekki. Erik hefur bent á að meginregla VLF er að hún tekur aðeins tillit til þeirra viðskipta sem eiga sér stað á markaði – þar sem greiðsla hefur átt sér stað. Það þýðir að öll þau verðmæti sem við njótum en greiðum ekki fyrir með beinum hætti — þau detta út. Þetta er ekki tilfallandi skekkja. Þetta er kerfisbundin blindni.

Virði þess sem hefur ekkert verð

Við getum tekið dæmi eins og Google, Wikipedia, kortaforrit, netpóst, og nú síðast – spunagreind eins og ChatGPT. Við notum þessi verkfæri daglega. Þau spara okkur tíma, auka afköst, og bæta ákvörðunartöku. En þar sem þau eru „ókeypis“, þá bætast þau ekki við VLF. Og þegar við deilum þeirri VLF með heildarfjölda vinnustunda – eins og gert er í framleiðni mælingum – virðist sem engin framleiðni aukning hafi átt sér stað, þrátt fyrir að vinnuaflið hafi hugsanlega orðið margfalt skilvirkara.

Brynjolfsson og samstarfsmaður hans Avinash Collis hafa því lagt til nýjan mælikvarða sem þeir kalla GDP-B – þar sem „B“ stendur fyrir „Benefit“. Með því að meta virði þess sem fólk væri tilbúið að sleppa við (e. willingness to accept) í skiptum fyrir að missa aðgang að þjónustu á borð við Google Maps, Spotify eða AI-tól þá fá þeir mælanlega mynd af velferðarábata sem ekki sést í VLF. Í rannsókn Brynjolfsson, Collis og Eggers (2019), spurðu þeir þátttakendur hversu mikla fjárhæð þeir þyrftu í „skaðabætur“ til að vera tilbúnir að afsala sér aðgangi að tiltekinni stafrænni vöru eða þjónustu í ákveðinn tíma. Til dæmis kom í ljós að miðgildi þátttakenda þurfti um það bil 48 dollara í bætur til að vera tilbúin að sleppa Facebook í einn mánuð. Þetta bendir til þess að hefðbundnir mælikvarðar, eins og VLF ná ekki að fanga raunverulegan velferðarábata sem stafar af ókeypis stafrænum vörum og þjónustu. Þessi aðferð hefur verið notuð af Brynjolfssyni og Collis til að meta hversu mikið virði felst t.d. í Facebook, YouTube og Google Search. Niðurstöðurnar benda til þess að velferðarábati stafrænna vara sé margfaldur á við þau tekjuverðmæti sem koma fram í VLF.

Þetta er munurinn á verðmætasköpun (value creation) og verðmætatöku (value capture). Ef verðmætasköpun er mikil fyrir viðskiptavininn, þ.e. við getum t.d. endalaust googlað, en verðmætataka fyrirtækisins er lítil, þ.e. þau bjóða okkur „frítt“ að googla, þá kemur það ekki fram í VLF. Ávinningur neytenda er hins vegar augljós. Með öðrum orðum: raunveruleg verðmætasköpun internetsins, forrita og AI-tækja er gríðarleg – en ósýnileg í VLF og mörgum öðrum opinberum hagfræðilegum mælikvörðum.

Stjórnmálamenn og hagfræðingar eiga á hættu að sjá ekki raunverulega verðmætasköpun í hagkerfinu ef þeir eru með úrelta mælikvarða sem þeir trúa á í blindni.


Við höfum verið að reyna að mæla velsæld og hagvöxt með mælikvarða sem var hannaður fyrir verksmiðjur og vörubíla – ekki fyrir gagnaský og forrit. Í því samhengi er áhugavert að skoða hugmyndina að GDP-B, sem byggist á því að meta raunverulegan ábata notenda af stafrænni þjónustu – óháð því hvort hún er greidd eða ekki. Markmiðið er að fanga þann hluta efnahagslífsins sem felst í velferðarávinningi (e. consumer surplus), en sem VLF hunsar.

Þessi hugsun er sérstaklega mikilvæg í umræðunni um spunagreind. Þegar starfsmaður notar AI til að tvöfalda afköst sín – án þess að kaupandinn greiði meira fyrir þjónustuna – þá aukast afköst einstaklingsins, en það endurspeglast ekki í VLF nema að framleiðslan sé seld á markaði. Þannig getur heill geiri hagkerfisins orðið öflugri og skilvirkari – án þess að það sjáist í mælingunum. Þetta er kjarninn í gagnrýni Brynjolfssonar: Við þykjumst vera í hagstjórn og með nýsköpunarstefnu á sama tíma og við notum gamla mælikvarða sem mæla ekki nýju verðmætin. Þegar við sjáum ekki hvaðan vöxturinn er að koma, fjárfestum við ekki með réttum hætti – og það getur verið dýrkeypt skekkja fyrir samfélagið.

Stjórnmálamenn og hagfræðingar eiga á hættu að sjá ekki raunverulega verðmætasköpun í hagkerfinu ef þeir eru með úrelta mælikvarða sem þeir trúa á í blindni. Það er auðvelt að styðja hráefna- og auðlindahagkerfið þegar það er ekki verið að mæla neitt annað. Á sama tíma er þá erfitt að réttlæta fjárfestingu í tækni og nýsköpun. Það er raunveruleg þversögn!

Rangar ákvarðanir

Það er auðvelt að afsaka það þegar sumir vitna rangt í aðra eins og tilviki Druckers í upphafi greinarinnar. Það er erfiðara að afsaka það þegar ranghugmyndir og vitlausir mælikvarðar eru notaðir til þess að leiða fyrirtæki og heilu samfélögin villur vegar. Við þurfum að vera viss um að við séum ekki festa okkur í mælikvörðum sem ná í raun ekki utan um það sem skiptir máli. Það eru mörg dæmi um þetta í fyrirtækjarekstri og það eru jafnvel dæmi um þetta þegar við horfum á stóru tölurnar sem ráða framþróun heilu hagkerfanna.

Peter Drucker var fyrstur, um miðja síðustu öld, til þess að sjá að þróun hagkerfisins myndi leiða til þess að þekkingarstarfsmaðurinn yrði æ mikilvægari og að við myndum þróast í þekkingarhagkerfi.



Til hafa það á hreinu þá er ekki verið að halda því hér fram að mælikvarðar séu ekki mikilvægir í rekstri fyrirtækja og hagkerfa. Þvert á móti skiptir það sköpum að mæla þar sem hægt er að mæla og að skilja hvað er árangur. Það sem er verið að benda á, það sem Drucker, Peters og Erik Brynjolfsson hafa verið að benda á, er að við megum ekki festast í röngum mælikvörðum sem eru að gefa okkur ranga mynd og hugsanlega hvetja okkur til þess að taka rangar ákvarðanir. Ákvarðanir mótast af þeim upplýsingum sem við byggjum þær á.

Peter Drucker var fyrstur, um miðja síðustu öld, til þess að sjá að þróun hagkerfisins myndi leiða til þess að þekkingarstarfsmaðurinn yrði æ mikilvægari og að við myndum þróast í þekkingarhagkerfi. Hann sagði líka síðar að við þyrftum að læra hvernig við myndum mæla árangur þekkingarstarfsmanna og við værum ekki búin að því. Við erum ekki enn búin að því, ekki frekar en að mæla ávinning tækni og nýsköpunar. Hann benti einnig á að þegar hagkerfið þróast í átt að þjónustu, nýsköpun og stafrænum virðiskeðjum — þá er ekki nóg að mæla vinnustundir eða vörumagn. Við verðum að læra að mæla það sem við áður töldum ómælanlegt — eða hætta að láta eins og að stjórnun byggist á tölum einum saman.

Það sem Drucker hefði kannski átt að segja, eða við að hafa ranglega eftir honum, er að: Ef þú skilur ekki hvað þú ert að mæla, þá getur þú ekki stýrt því. Gallaður mælikvarði er ekki betri en enginn mælikvarði heldur getur hann einmitt leitt til þess að fyrirtæki og samfélag fari í þveröfuga átt en þau hefðu betur farið til að tryggja framþróun og árangur.

Höfundur er forseti Akademias.




Umræðan

Sjá meira


×