Neporovnávejte mzdy u vás ve firmě s průměrem, je to nesmysl

Foto: Václav Jedlička

Dalibor Holý je jedním z lidí, kteří toho vědí o našem pracovním trhu možná nejvíc. Je totiž šéfem odboru statistiky trhu práce a rovných příležitostí na Českém statistickém úřadě. Vyprávěl nám o tom, jak se trh práce měří, a třeba taky o tom, proč je v Turecku o polovinu nižší rozdíl mezi platy mužů a žen než u nás.

Předpokládám, že statistika vyžaduje nějaká vstupní data. Jak je sbíráte?

Získáváme je z několika zdrojů. Český statistický úřad zaměstnává 220 tazatelů, kteří provádí terénní šetření v domácnostech. Každý den obchází náhodně vybrané byty, a pokud nám jejich obyvatelé dají svolení, nabíráme data u nich. Druhým zdrojem je dotazování v podnicích, které provádíme ve všech velkých firmách a na vzorku firem malých. V nich sbíráme především údaje o zaměstnancích a jejich platech, z čehož pochází ten ohromně populární údaj o průměrné mzdě. Takto nasbíraná čísla doplňujeme o data získaná z institucí, které je vytvořily jako vedlejší produkt své agendy. Nejvíce údajů získáváme z informačního systému o průměrných výdělcích ISPV, který provozuje ministerstvo práce. Z něj vytváříme nejrůznější rozpady – kolik berou muži a ženy, rozdělení podle věku, vzdělání, délky praxe a podobně.

Omezujete se jen na čísla, nebo sbíráte i názory a dojmy? Třeba jak jsou lidé spokojení…

Anketních zjišťování moc nemáme, ale čas od času nám nějaký takový požadavek přijde. Tady je asi důležité vysvětlit, že fungujeme ve velmi úzkém propojení se statistickými institucemi Evropské unie. V integraci do EU jsme o hodně dál než jiné české úřady. Svoje úkoly si tedy nevymýšlíme jen sami. Chodí nám z evropských institucí. Mezi nimi se sem tam požadavek zjišťování nějakého vysloveně subjektivního názoru objeví, zvlášť při šetření v domácnostech, kterých je poměrně dost. My to tedy nemáme úplně rádi, protože klasická statistika s takovými údaji neumí zacházet. Otázky se musí proto volit tak, aby odpovědi bylo možné klasifikovat na nějaké stupnici a převést na čísla, která pak můžeme zpracovat.

Které vaše šetření tedy spadá do té klasické statistiky?

Největší šetření, které probíhá už desítky let v podstatě nepřetržitě, se jmenuje Výběrové šetření pracovních sil. Jeho účelem je roztřídit populaci na pracující, nepracující a na ty, kteří si práci hledají. Odvozujeme z něj základní ekonomické údaje, jako je míra zaměstnanosti a nezaměstnanosti. K tomuto dlouhodobému šetření se přidávají různé krátkodobé moduly, které se každý rok mění. Můžeme třeba zkoumat slaďování pracovního a rodinného života. Ptáme se, jestli si může zaměstnanec volit začátek pracovní doby, jestli může z práce odcházet dřív kvůli dítěti, volit si kratší úvazky a podobně. Nebo šetříme, jakým způsobem lidé nastupují do první práce nebo jak z ní odcházejí, jak plánují odchod do důchodu. Loni jsme prováděli velkou analýzu sebezaměstnaných, ve které jsme se zaměřovali na takzvaný „švarcsystém“. Tedy na pracovníky, kteří jsou formálně živnostníci, ale pracují pro jednoho zaměstnavatele, na kterém jsou závislí.

Kolik jich je?

Překvapivě jsme zjistili, že docela málo. Z celkového počtu 852 tisíc zjištěných odpovědí jich mělo pouze jednoho klienta 58,4 tisíc podnikatelů. Nejčastěji tito podnikatelé pracovali ve službách a prodeji. Dalších 103,4 tisíc osob pak odpovědělo, že více než tři čtvrtiny příjmů má od jednoho dominantního klienta, to byli hlavně řemeslníci a opraváři a dále specialisté. Celkově je tak 19 % podnikajících, kteří nejsou příjmově zcela nezávislí.

Jak víte, že se údaje získané od vámi vybraného vzorku lidí dají aplikovat i na zbytek populace?

Většina zjišťování je, jak říkáme, výběrových. Plošné dotazování se provádí jen při sčítání lidu, domů a bytů. Z toho ovšem získáme přehled o složení populace, početnosti věkových skupin a další údaje, na jejichž základě jsme schopni si pak údaje získané od vybraného vzorku dopočítat. Každému záznamu od jednotlivého respondenta se přiřadí na základě demografických zjištění určitá váha a údaje ze záznamu se „naváží“ na celou republiku. Víme, že když se ptáme dejme tomu zaměstnaného čtyřicátníka z Opavy, jeho odpovědi budou aplikovatelné na dalších 200–250 čtyřicátníků z Opavska.

Hledáte lidi? Oslovte je přes Jobs.cz a Prace.cz, největší pracovní portály u nás.

Je takový systém spolehlivý? Nevznikají chyby?

Vznikají. Statistika s nimi ale počítá a dokáže s nimi pracovat. První druh chyb jsou chyby výběrové, které závisí na velikostí dotazovaného vzorku a musí se zohlednit v matematických modelech. Když mluvíme třeba o dvouprocentní nezaměstnanosti, měli bychom správně říkat: míra nezaměstnanosti v České republice se s 95% pravděpodobností pohybuje mezi 1,7 a 2,3 %. Pak máme ještě chyby způsobené zkreslením. S těmi se pracuje složitěji, protože jsou dané způsobem provádění průzkumu. Když se například budete dotazovat na náboženskou víru v kostele, dostanete diametrálně jiné odpovědi než při dotazování na plovárně, přestože budete mít stejně velký výběrový vzorek. Tuto chybu se snažíme co nejvíce korigovat, ale máme své hranice. Například se ptáme jen lidí v bytech. Když ale člověk bydlí v bytě, je už členem určité skupiny populace, jejíž údaje nemusí vypovídat nic třeba o lidech žijících v ubytovnách nebo pod mostem. Jsou také lidé, kteří naše kolegy do bytu nepustí a nic jim neřeknou. Je docela dobře možné, že jsou to lidé, kteří jsou frustrovaní z dlouhodobé nezaměstnanosti, a naše odhady počtu lidí bez práce mohou být podhodnocené.

Snažíte se v takovém případě údaje stejně nějakým způsobem získat?

Ono to dost dobře nejde. Jediná možnost by byla zajít k sousedům a zkoumat, proč se s námi ti lidé nechtějí bavit. To už bychom se ale dopouštěli přílišného narušení soukromí a to neděláme.

Měli bychom tedy při čtení statistik počítat s tím, že jsou čísla možná zkreslená?

Ano. Je velmi důležité všechny údaje číst v kontextu mezinárodní a celorepublikové situace a v rámci nějakého časového období. Vývoj statistických údajů je zpravidla užitečnější než jednotlivé údaje. Jedno číslo nám toho vlastně moc neřekne.

Právě jednotlivá čísla se ale často prezentují jako výsledky vaší práce. Jen o průměrné mzdě nebo té dvouprocentní nezaměstnanosti čtu minimálně třikrát denně.

Bohužel jsou to přesně ty údaje, které samy o sobě o ničem nevypovídají. Když napíšu, že průměrná mzda je 32,5 tisíce, tak co to komu řekne? Takto izolované číslo je dobré jen k tomu, aby lidé porovnávali, jestli berou víc, nebo méně, a jelikož většina bere méně, tak jsou pak kvůli tomu naštvaní.

Jak bychom tedy s údajem o průměrné mzdě měli zacházet?

Zajímavé je třeba sledovat, jak se vyvíjí v čase. Když vidíme, že průměrná mzda meziročně vzrostla o osm procent, můžeme s velkou jistotou tvrdit, že se naší ekonomice daří. Nebo ho můžeme porovnávat mezi jednotlivými regiony. Průměrná mzda v Praze mi moc sama o sobě neřekne. Když řeknu, že pražská mzda je o čtvrtinu vyšší než v jiných okresech, je to už relevantní a zajímavý údaj, ze kterého se dá leccos usuzovat. Statistika je zkrátka o mnoha číslech. Ne o jednom.

Nemohli by se dnes statistici obejít bez přímého dotazování lidí? Nepřinášela by lepší výsledky třeba analýza sociálních sítí? Firmy specializované na „Big Data“ přece tvrdí, že podle padesáti lajků ví o uživateli víc než jeho partner.

Problém takových datových souborů spočívá v jejich přístupnosti a způsobech, jak je získávat. Proto o analýze sociálních sítí zatím neuvažujeme. Je to nicméně velké téma v diskuzích a ozývají se čím dál tím častěji názory, že bychom „Big Data“ nějakým způsobem využívat měli. V procesu je už dohoda s AirBnB, které nám bude poskytovat data o počtu turistů na krátkodobých pobytech. Přemýšlí se také například o využívání údajů mobilních operátorů pro šetření dojíždění do práce. Místo abychom se lidí ptali, kde bydlí, kde pracují a jak tam dojíždějí, podíváme se, kde jsou mobily v noci, kde jsou přes den během pracovní doby a jak se pohybují mezi tím. To jsou velmi užitečné údaje, podle kterých se třeba plánuje navyšování kapacity komunikací, posilování linek veřejné dopravy nebo stavba dálnic. „Big Data“ jsou zkrátka velmi zajímavá oblast, ze které bychom mohli získávat rychlé a aktuální informace doplňující klasickou statistiku – velký, trochu těžkopádný stroj, který se valí kupředu a snaží se zachovat kontinuitu velkých časových řad, které jsou naším největším bohatstvím.

Jak dlouho ty velké průzkumy pracovního trhu Český statistický úřad provádí?

Probíhají už od 50. let, ale jejich zaměření se samozřejmě během let měnilo. Za reálného socialismu se sledovaly hlavně podnikové údaje. Počty zaměstnanců v různých odvětvích. Kolik se jim platí na mzdách. Strukturální zjišťování u jednotlivých zaměstnanců – v jakém jsou věku a jakého pohlaví, to se provádí stále. Mění se ale klasifikace zaměstnání vycházející ze změn ve struktuře ekonomiky. Dnes se třeba nejvíc rozvíjí obor informačních a komunikačních technologií, který poměrně nedávno v podstatě neexistoval. Kvůli takovým změnám je nutné naše dlouhodobé datové řady přerušit a navázat je na nové, popřípadě se pokusit na novou klasifikaci přepočítat i staré údaje. To jde ale provést jen do určité míry. Když po nás tedy někdo chce dlouhodobý vývoj mezd programátorů, můžeme jít jen tak hluboko do historie, kde nějaký reprezentativní vzorek programátorů existoval a je popsaný natolik, abychom údaje mohli překódovat.

Říkal jste, že spolupracujete se zahraničními kolegy a máte přístup k přehledům údajů o trzích práce napříč Evropou. Jak v takovém celkovém přehledu vypadá Česko?

Když se podíváme třeba na mapu Evropy rozdělenou na oblasti NUTS2, kterým se vyplácí strukturální fondy, jasně vidíme, že Evropa je rozdělena na jádro a periferii. My naštěstí patříme k jádru. S výjimkou Moravskoslezského kraje je u nás minimální nezaměstnanost, stejně jako v přiléhajících oblastech. Jih Evropy, hlavně jižní Itálie, Sardinie, Srbsko, Makedonie, Černá hora, Řecko, jižní polovina Španělska, naopak s nezaměstnaností bojuje. Podobné rozložení uvidíme například i v přehledu zaměstnanosti žen. Centrum a skandinávské státy ji mají velmi dobrou, v Řecku je každá druhá žena bez zaměstnání. Tyto základní údaje pak musíme mít na paměti, když vyhodnocujeme podrobnější informace. Například se občas můžete dočíst, že v Česku je velká platová nerovnost mezi muži a ženami a že třeba v Turecku je „Gender Pay Gap“ poloviční. My ale víme, že je to způsobeno tím, že v Turecku pracují prakticky výhradně dobře situované ženy, které mají dobré zaměstnání a pobírají vysoké platy. Chudší ženy jejich průměr nesnižují, protože prostě placené zaměstnání nemají.

Co vidíte, když se podíváte dovnitř naší republiky?

Je to podobné jako s Evropou, tedy platí rozdělení na centrum a periferie. Problematické jsou příhraniční oblasti, kam směřuje málo investic a kde je špatná dopravní obslužnost. Ta mimochodem vytváří i jakási vnitřní pohraničí na pomezích krajů. Třeba Posázaví, oblast mezi Středočeským, Jihočeským krajem a Vysočinou špatnou dopravou dost trpí, je tam málo práce, mladí lidé se odsud stěhují do velkých měst. Poměrně znepokojující údaje vyplývají i z našich průzkumů příjmů a životních podmínek domácností. V nich se například zjišťuje, co si domácnost nemůže dopřát. Díky nim víme, že je u nás velké množství domácností, které si nemohou dovolit zaplatit jednorázový výdaj ve výši kolem 10 000 korun. Když jim odejde pračka nebo se porouchá auto, ocitnou se v situaci, kterou budou jen těžko řešit. Naštěstí se jejich podíl postupně snižuje.

Je něco, o čem vy statistici víte, ale my vás neposloucháme?

Občas je složité protlačit na veřejnost, jak výsledky naší práce používat. Novináři si rádi vybírají čísla, která se jim hodí do zprávy. Používají je jako argumenty svého tvrzení, aniž by si ověřili, co ten údaj vlastně znamená. Statistika totiž pracuje s pojmem „rozptyl“ a u průměrných čísel, která tak rádi sdílíme a čteme, bývá rozptyl dost velký. Nemá třeba cenu porovnávat svůj plat s platem průměrným, kde se skrývají špičkoví manažeři, chirurgové, ale také prodavačky a nekvalifikovaní dělníci. Je potřeba vynaložit trochu úsilí, použít podrobnější třídění a najít si údaj o svém zaměstnání a lidech s podobnou pozicí.

Dalibor Holý

Vystudoval matematiku a společenské vědy na Pedagogické fakultě UK a statistiku na VŠE. Od roku 1996 působí na Českém statistickém úřadě, od roku 2010 jako ředitel odboru statistiky trhu práce a rovných příležitostí.

Věděli jste, že podobně velké průzkumy trhu práce provádíme čtyřikrát ročně i v LMC? A o unikátní data, která získáváme na reprezentativním vzorku populace, se s vámi rádi dělíme třeba na Datových snídaních připravovaných analytikem Tomášem Ervínem Dombrovským. K dispozici máme informace, které mnohdy nikdo jiný nemá.

Sdílejte
 
Jste zvyklí při náboru spolupracovat s manažery?
0