Οι εποχές που οι εφοριακοί έψαχναν τα βιβλία και τα φορολογικά στοιχεία για να εντοπίσουν αδήλωτα εισοδήματα, έχουν περάσει ανεπιστρεπτί.
Ήδη, οι ελεγκτικές υπηρεσίες έχουν εισάγει την Τεχνητή Νοημοσύνη στην επιλογή και τον εντοπισμό των στόχων και η τελευταία μεγάλη υπόθεση με το κύκλωμα 205 αχυρανθρώπων και 380 επιχειρήσεων, αποδεικνύει ότι οι ειδικοί αλγόριθμοι κάνουν θαύματα. Το μεγάλο άλμα θα γίνει με την υιοθέτηση των μοντέλων που εφαρμόζει το φοβερό και τρομερό IRS, δηλαδή η αμερικανική οικονομική αστυνομία, για τον εντοπισμό περιπτώσεων φοροδιαφυγής ή φοροαποφυγής ακόμα και πριν αυτές εκδηλωθούν.
Το IRS εφαρμόζει συστήματα τεχνητής νοημοσύνης και machine learning για να αναλύει τεράστιες ποσότητες φορολογικών δεδομένων και να εντοπίζει δηλώσεις με υψηλό δείκτη πιθανής ανακρίβειας ή φοροδιαφυγής. Τα βασικά χαρακτηριστικά είναι:
Ανάλυση μεγάλου όγκου δεδομένων: AI συστήματα συγκρίνουν εκατομμύρια δηλώσεις με προηγούμενα μοτίβα μη συμμόρφωσης για να εντοπίσουν «ανωμαλίες». Βαθμολογία κινδύνου (risk scoring): Κάθε φορολογική δήλωση παίρνει έναν βαθμό κινδύνου με βάση τη συμπεριφορά του φορολογούμενου, στοιχεία τρίτων, και ιστορικά δεδομένα. Αυτοί με υψηλότερες τιμές είναι πιο πιθανό να «επιλεγούν» για έλεγχο. Στόχευση πιο σύνθετων υποθέσεων: Ειδικά για μεγάλες εταιρείες, σύνθετες συνεργασίες (partnerships) και υψηλά εισοδήματα, τα μοντέλα AI μπορούν να ανιχνεύσουν δομές ή συμπεριφορές που αποφεύγουν φορολογικές υποχρεώσεις.
Οι αλγόριθμοι του IRS δεν ψάχνουν απλώς για λάθη, αλλά για στατιστικές αποκλίσεις. Αν η φορολογική δήλωσή “ξεχωρίζει” από τον μέσο όρο της κατηγορίας, το σύστημα χτυπάει “καμπανάκι”. Για παράδειγμα, ο κεντρικός αλγόριθμος DIF δίνει έναν αριθμητικό βαθμό σε κάθε δήλωση. Συγκρίνει τα δεδομένα με τα «φυσιολογικά» επίπεδα ατόμων με παρόμοιο εισόδημα και επάγγελμα. Υψηλό σκορ σημαίνει μεγάλη πιθανότητα σφαλμάτων ή απόκρυψης, γεγονός που στέλνει τη δήλωση για έλεγχο από ανθρώπινο μάτι. Επιπλέον, ένας εξειδικευμένος υπο-αλγόριθμος UIDIF βαθμολογεί αποκλειστικά την πιθανότητα να έχει «ξεχαστεί» η δήλωση πηγών εισοδήματος.
Ποιες είναι «κόκκινες σημαίες» (red flags), που σημαίνουν συναγερμό;
Επαγγελματικά Έξοδα- Είναι ο νούμερο ένα στόχος των αλγορίθμων για ελεύθερους επαγγελματίες:
Στρογγυλοποιημένα ποσά: Αν τα έξοδά καταλήγουν πάντα σε 0 ή 5 (π.χ. 5.000 ευρώ αντί για 4.982 ευρώ), ο αλγόριθμος το εκλαμβάνει ως ένδειξη ότι τα νούμερα είναι κατασκευασμένα και όχι πραγματικά Δυσανάλογες δαπάνες: Έξοδα γευμάτων, ψυχαγωγίας ή ταξιδιών που φαίνονται υπερβολικά σε σχέση με το συνολικό εισόδημα της επιχείρησης. Συνεχόμενες ζημίες: Αν δηλώνεται ζημία για 3 από τα τελευταία 5 έτη, ο αλγόριθμος μπορεί να ανακατατάξει την επιχείρησή ως «χόμπυ» (Hobby Loss Rules), ακυρώνοντας όλες τις εκπτώσεις.
2. Αποκλίσεις στο Εισόδημα (Income Mismatch): Ο αλγόριθμος AUR (Automated Underreporter) κάνει αυτόματη διασταύρωση. Αν μια εταιρεία δηλώσει ότι πλήρωσε 1.000 ευρώ και ο αντισυμβαλλόμενος δεν το αναφέρει, η ειδοποίηση εκδίδεται αυτόματα χωρίς ανθρώπινη παρέμβαση. Όσο για κρυπτονομίσματα, οι πλατφόρμες (Coinbase, Kraken κ.λπ.) στέλνουν δεδομένα απευθείας στο IRS και οποιαδήποτε απόκρυψη κερδών από digital assets είναι πλέον εύκολα ανιχνεύσιμη
3. Τρόπος Ζωής vs Δηλωθέν Εισόδημα: Αν δηλώνεται εισόδημα π.χ. 30.000 ευρώ αλλά πληρώνεται στεγαστικό δάνειο για σπίτι εκατομμυρίων, ο αλγόριθμος του IRS χρησιμοποιεί δημόσια δεδομένα και social media analytics για να εντοπίσει την αναντιστοιχία.
4. Υψηλά Εισοδήματα και Φιλανθρωπίες: το IRS θα αυξήσει τους ελέγχους σε αυτή την κατηγορία, με στόχο τον τριπλασιασμό τους. Για παράδειγμα, με τον ειδικό αλγόριθμο, αυξάνεται το “σκορ” αν οι φιλανθρωπικές δωρεές είναι πολύ υψηλότερες από τον μέσο όρο των ατόμων με το ίδιο εισόδημα
5. Έκπτωση Γραφείου στο Σπίτι: Αν και είναι νόμιμη, ο αλγόριθμος την εξετάζει αυστηρά. Αν ο χώρος που δηλώνεται ως γραφείο φαίνεται να καταλαμβάνει το… μισό σπίτι ή αν ο εξοπλισμός δεν συνάδει με το επάγγελμά, θεωρείται ύποπτο.
Ο φόβος και ο τρόμος για τους φοροφυγάδες είναι το γεγονός ότι τα μοντέλα Τεχνητής Νοημοσύνης ανατροφοδοτούνται από δεδομένα και περιπτώσεις φοροδιαφυγής, εξελίσσοντας έτσι τις μεθόδους εντοπισμού. Το AURA, που χρησιμοποιεί και αξιοποιεί το IRS, είναι ένα νέο μοντέλο που μαθαίνει τι είναι «φυσιολογικό» μελετώντας εκατομμύρια δηλώσεις, εντοπίζοντας έτσι άτυπα μοτίβα που οι παλαιότεροι αλγόριθμοι αδυνατούσαν να δουν. Επιπλέον, το Σύστημα Σύστασης Ανωμαλιών Γραμμής (LAR), χρησιμοποιείται για μεσαίες επιχειρήσεις, αξιολογώντας τη σχέση μεταξύ διαφορετικών κωδικών της δήλωσης αντί να εξετάζει τον καθένα μεμονωμένα.
Αυτό που μπορεί να κάνει τη διαφορά και στους ελληνικούς ελεγκτικούς μηχανισμούς είναι ότι πέρα από τον απλό έλεγχο, το IRS χρησιμοποιεί μοντέλα που ανιχνεύουν μοτίβα απάτης ή κινδύνου — όχι μόνο στο στάδιο της επιλογής στόχων ελέγχου (audit selection), αλλά και στον εντοπισμό πιθανών περιπτώσεων απάτης, ΠΡΙΝ εγκριθούν επιστροφές φόρων. Υπό συζήτηση/προγραμματισμό είναι και εργαλεία που στοχεύουν στη προληπτική ανίχνευση ζητημάτων κατά την υποβολή των δηλώσεων, όχι απλώς μετά και επί της ουσίας αυτό σημαίνει ότι η Τεχνητή Νοημοσύνη μπορεί να σταματάει αυτόματα συγκεκριμένες συναλλαγές ή επιστροφές μέχρι να γίνει περαιτέρω επανέλεγχος.
