Lídr našeho datového týmu Adam vypíchnul 6 důvodů, proč dělat v Dateio.
Na náš problém neexistuje snadné univerzální řešení. Není to o tom, že dostaneš jasné zadání a máš postup, jak dojít k výsledku. Nelze ani jednoduše data nalít do machine learningu, aby problém vyřešil.
Například v arabských zemích jsou obří řetězce, které prodávají všechno od potravin po oblečení. Takže čistě z údaje o jménu obchodníka nepoznáme, o jaký nákup se jednalo. Musíme vymyslet, jak platbu lépe identifikovat kombinací spousty vedlejších signálů a parametrů.
Je to hodně kreativní hackerské práce. Musíme vymyslet, jak obří problém rozdělit do podúkolů a ty pak řešit jeden po druhém. Proto hledáme lidi, kteří nemyslí v zajetých kolejích, ale umí vyřešit problémy, které před nimi nikdo neřešil.
Člověk si u nás vyzkouší datovou práci od A do Z. Dostane na starosti svůj projekt a udělá si vše od prvotního nápadu po realizaci. To ho naučí o problémech přemýšlet v souvislostech.
Jinde by dostal vstupní data a podle lineární regrese dostal výsledné číslo. U nás to znamená větší šířku a možnost osahat si různé technologie. Napsat si prvotní skript a přes Jenkins ho automatizovat.
Jedním z příkladů je vlastní nástroj na scrapování log obchodníků z jejich webů. Kolega udělal v Pythonu a Djangu stránku, která na URL adrese obchodníka vyhledá obrázky, které se tváří jako logo (podle velikosti, popisu, linku, kam odkazují), a nabídne je na manuální posouzení. Člověk rychle vybere to správné – a tímto praktickým toolem se proces zrychlil asi pětinásobně.
Děláme práci, která má reálný přínos. Naše data používají v aplikaci mobilního bankovnictví desítky milionů lidí.
Je super, že to je služba, která vzniká v Česku a používá ji celý svět. Na tuto oblast se specializuje jenom pár firem na světě a my jsme schopni je porážet.
V korporátu by výsledný efekt práce nebyl takhle vidět. Tady může člověk vymyslet nový automatizační skript, otestovat ho a za dva týdny vidí, jak to na konkrétních datech pomohlo. Najednou rozpoznáme deset tisíc nových obchodníků a poměr automatizace stoupne o několik procent. A všem to ušetří práci. Na konci roku vidíme, jakou kopu měřitelné práce jsme za sebou nechali.
V týmu máme plno talentovaných mladých lidí. Jsou tu doktorandi z jaderky nebo absolventi matfyzu. Spousta chytrých lidí, od kterých je hodně co se naučit. Vzájemné sdílení know-how je samozřejmost. Náš technický co-founder má PhD. z aplikované matematiky, takže důraz na poctivou expertní znalost máme v genech.
Na zpracování big dat používáme primárně SQL a Python. Bokem máme modernější technologie jako Kibana nebo Grafana. Hodně věcí automatizujeme do Djanga, což je nadstavba Pythonu.
Pro kontroly používáme neuronové sítě a máme spoustu kvalitně zpracovaných dat pro machine learning. Cloud máme v AWS, automatizaci děláme primárně v Jenkinsu, a protože Tapix je dockerová služba, pracujeme i s Kubernetes.
Ale není to vše jen o práci a technologii. Jsme kolektiv lidí, kteří se i mimo práci věnují svým koníčkům a nesedí na gauči. Vůbec nejoblíbenější je u nás sport, v Dateio sportují skoro všichni a to platí hlavně pro náš datový tým.
Někteří z nás jezdí na kole nebo běhají, někteří se sportu věnují na profesionální úrovni. Máme kolegu, který je mistrem SR v krátkém triatlonu, horolezce, i volejbalistku s několikanásobnou účastí na mistrovství světa. Proto taky není problém si u nás zaparkovat kolo nebo pověsit propocený dres.