Πρέπει το ModelOps να είναι ανεξάρτητο από την επιστήμη των δεδομένων; [Part 2]
März 4, 2023Του Stu Bailey, συνιδρυτή και Chief Enterprise AI Architect στο ModelOp
Επιστρέψτε ξανά στην ερώτησή μας από το προηγούμενο άρθρο μου: „Είναι η καλύτερη πρακτική για το Enterprise AI ότι το ModelOps πρέπει να είναι ανεξάρτητο από την επιστήμη δεδομένων τόσο στην πράξη όσο και στην πλατφόρμα;“
Η εισαγωγή/σχόλια/συζήτηση από την προηγούμενη ανάρτηση ήταν πολύ ενδιαφέρουσα και σύμφωνη με την εμπειρία μας.
Εμείς στο ModelOp ασχολούμαστε με πολλές πολύ μεγάλες, μη ψηφιακές εγγενείς επιχειρήσεις που παλεύουν με το ερώτημα πώς να κυβερνήσουν και να κλιμακώσουν τις πρωτοβουλίες τεχνητής νοημοσύνης τους, επομένως βρισκόμαστε στην πρώτη γραμμή αυτού του αγώνα. Εδώ είναι αυτό που βλέπουμε:
- Η κατάσταση των επενδύσεων στην επιστήμη δεδομένων γίνεται ανησυχία σε επίπεδο συμβουλίων και θέτουν δύσκολα ερωτήματα, π.χ. «Είμαστε σήμερα σε θέση να διεξάγουμε πλήρη έλεγχο όσον αφορά το κόστος, την απόδοση, την προέλευση και τη γενεαλογία όλων των μοντέλων στην παραγωγή σε όλες τις επιχειρήσεις , κίνδυνος, ασφάλεια, τεχνολογία, μετρήσεις επιστήμης δεδομένων;»
- Ενώ οι αρχικές επενδύσεις στην επιστήμη δεδομένων έχουν δείξει μεγάλη ικανότητα να προσφέρουν απτή αξία, έχουν αποκαλυφθεί σοβαρές προκλήσεις που σχετίζονται με τη λειτουργική πολυπλοκότητα και τη διαχείριση κινδύνου σε κλίμακα.
- Οι οργανισμοί έχουν πραγματοποιήσει μεγάλες, πολυετείς επενδύσεις για την υποστήριξη της τεχνητής νοημοσύνης, συμπεριλαμβανομένης της κατασκευής τεράστιων λιμνών και αγωγών δεδομένων, της πρόσληψης επιστημόνων δεδομένων και της απόκτησης πολλαπλών πλατφορμών ανάπτυξης και εκτέλεσης επιστήμης δεδομένων.
- Τα μοντέλα αναγνωρίζονται ως τα συγκεκριμένα και αναγνωρίσιμα περιουσιακά στοιχεία της επιχείρησης που προκύπτουν από επενδύσεις στην επιστήμη δεδομένων.
- Το ModelOps αναγνωρίζεται όλο και περισσότερο ως θεμελιώδης πυλώνας μιας στρατηγικής Enterprise AI [“Market Guide for AI Trust, Risk and Security Management,” Avivah Litan et al, September 1, 2021];
Υπό το φως αυτής της δυναμικής, η συζήτηση γύρω από το ModelOps γίνεται πιο έντονη. Ένα πράγμα που βλέπουμε είναι ότι τα έργα DIY ModelOps χάνουν την υποστήριξη από λύσεις που παρέχονται από προμηθευτές, επειδή λίγες επιχειρήσεις μπορούν να δημιουργήσουν και να διατηρήσουν ανταγωνιστικές πλατφόρμες ModelOps με οποιοδήποτε λογικό κόστος. Και ο αριθμός των εμπορικά διαθέσιμων προσφορών αυξάνεται. Σχεδόν κάθε προμηθευτής πλατφόρμας επιστήμης δεδομένων ισχυρίζεται τώρα ότι θα είναι σε θέση να παρέχει όλη την απαραίτητη επιχειρησιακή (μη επιστήμη δεδομένων) διακυβέρνηση και υποστήριξη σε όλες τις λειτουργίες του Enterprise για ΟΛΑ τα μοντέλα – κάποια μέρα. Αλλά σήμερα, σχεδόν όλες αυτές οι προσφορές περιορίζονται σε δυνατότητες και μοντέλα MLOps που αναπτύσσονται από επιστήμονες δεδομένων στη συγκεκριμένη πλατφόρμα. Αλλά ακόμα κι αν οι πωλητές πλατφορμών επιστήμης δεδομένων μπορούσαν να αναπτύξουν και να βγουν στην αγορά με ολοκληρωμένες δυνατότητες ModelOps, θα ήταν καλή ιδέα να τις χρησιμοποιήσετε; Από ό,τι βλέπουμε, η απάντηση είναι κατηγορηματικά «ΟΧΙ», για διάφορους λόγους:
- Η επιστήμη των δεδομένων εξελίσσεται γρήγορα και καμία πλατφόρμα δεν τα κάνει όλα. Οι επιστήμονες δεδομένων χρειάζονται την ελευθερία να χρησιμοποιούν τα καλύτερα εργαλεία και τεχνικές για την αντιμετώπιση κάθε περίπτωσης χρήσης. Γι‘ αυτό οι μεγάλες επιχειρήσεις αναφέρουν ότι χρησιμοποιούν τουλάχιστον 4 πλατφόρμες επιστήμης δεδομένων, ενώ ορισμένες χρησιμοποιούν 7 ή περισσότερες. Και δεν υπάρχουν στοιχεία ότι αυτή η τάση θα αντιστραφεί. Το να συνδέεις το ModelOps με μια συγκεκριμένη πλατφόρμα επιστήμης δεδομένων είναι αρκετά ικετευτικό να κλειδωθείς στο δρόμο.
- Τα μοντέλα μηχανικής εκμάθησης είναι πολύ σημαντικά, αλλά σε καμία περίπτωση δεν είναι ο μόνος τύπος μοντέλων που χρησιμοποιούνται, ούτε θα είναι. Οι πελάτες και οι υποψήφιοί μας αναγνωρίζουν ότι τα „μοντέλα“ θα μπορούσαν να είναι η μηχανική εκμάθηση, η βαθιά εκμάθηση, η επεξεργασία φυσικής γλώσσας, τα μεγάλα δεδομένα, τα μοντέλα μικρών δεδομένων, τα βασισμένα σε κανόνες, τα παλαιού τύπου μοντέλα και οι τύποι μοντέλων που δεν έχουν ακόμη ανακαλυφθεί. Αυτό διακρίνει περαιτέρω το ModelOps ως επιχειρηματική ικανότητα έναντι του MLOps, το οποίο είναι ένα εργαλείο για την επιστήμη των δεδομένων.
- Η επιστήμη των δεδομένων αφορά την καινοτομία, την ελευθερία και την εξερεύνηση. Το ModelOps αφορά την κωδικοποίηση και την αυτοματοποίηση εταιρικών προτύπων για πολιτική, διαδικασίες και λογοδοσία. Υπάρχει θεμελιώδης ασυμφωνία στην προσπάθεια εξυπηρέτησης και των δύο αυτών στόχων με ένα ενιαίο σύστημα.
- Οι επιχειρήσεις χρειάζονται μια ενιαία, κεντρική πλατφόρμα ModelOps που να είναι εξίσου αποτελεσματική για όλα τα μοντέλα από όλες τις πηγές – δηλαδή εντελώς αγνωστική ως προς το από πού προέρχονται τα μοντέλα και πού αναπτύσσονται. Είναι δύσκολο να φανταστεί κανείς πώς ένας προμηθευτής μιας πλατφόρμας επιστήμης δεδομένων/εκτέλεσης θα άφηνε στην άκρη τους δικούς του επιχειρηματικούς στόχους (π.χ. κυριαρχία στην αγορά) και θα ήταν εξίσου φιλικός προς όλα τα μοντέλα και όλα τα περιβάλλοντα ανάπτυξης.
- Η διαχείριση κινδύνου απαιτεί επιβολή συμμόρφωσης, η οποία με τη σειρά της απαιτεί διαχωρισμό μεταξύ εκείνων που κάνουν ανάπτυξη –επιστήμονες δεδομένων– από αυτούς που διαχειρίζονται τον κίνδυνο. Η χρήση επιστημόνων δεδομένων και των πλατφορμών τους για την επιβολή της συμμόρφωσης είναι σαν να αφήνουμε τους μαθητές να βαθμολογήσουν τα δικά τους έγγραφα.
Λοιπόν, επιστρέφουμε ξανά στην ερώτησή μας: «Είναι η καλύτερη πρακτική για το Enterprise AI ότι το ModelOps πρέπει να είναι ανεξάρτητο από την επιστήμη των δεδομένων τόσο στην πράξη όσο και στην πλατφόρμα;» Όλα στην εμπειρία μας λένε ναι – η διατήρηση της ανεξαρτησίας του ModelOps σημαίνει ελευθερία επιστήμης δεδομένων και χαμηλότερο επιχειρηματικό κίνδυνο – με κλασματικό κόστος.