Πώς να ξεπεράσετε τη διαφημιστική εκστρατεία AI για να γίνετε μηχανικός μηχανικής μάθησης

Είμαι βέβαιος ότι έχετε ακούσει για τις απίστευτες εφαρμογές τεχνητής νοημοσύνης εκεί έξω - από προγράμματα που μπορούν να κερδίσουν τους καλύτερους παίκτες Go στον κόσμο έως τα αυτοκίνητα αυτο-οδήγησης.

Το πρόβλημα είναι ότι οι περισσότεροι άνθρωποι εμπλέκονται στη διαφημιστική εκστρατεία AI, συνδυάζοντας τεχνικές συζητήσεις με φιλοσοφικές.

Αν ψάχνετε να διαγράψετε τη διαφημιστική εκστρατεία AI και να εργαστείτε με μοντέλα δεδομένων που έχουν εφαρμοστεί πρακτικά, προχωρήστε σε μια θέση μηχανικού δεδομένων ή μηχανικού μάθησης.

Μην ψάχνετε για ενδιαφέρουσες εφαρμογές AI σε άρθρα AI. Αναζητήστε τα σε σεμινάρια μηχανικής δεδομένων ή μηχανικής μάθησης

Αυτά είναι τα βήματα που έκανα για να φτιάξω αυτό το διασκεδαστικό μικρό ξύστρα που έφτιαξα για να αναλύσω την ποικιλομορφία των φύλων σε διαφορετικούς κωδικούς εκκίνησης. Είναι το μονοπάτι που έκανα για να κάνω έρευνα για το νέο online bootcamp AI / ML της Springboard με εγγύηση εργασίας.

Ακολουθεί ένας βήμα προς βήμα οδηγός για να μπείτε στον χώρο της μηχανικής μάθησης με ένα κρίσιμο σύνολο πόρων που συνδέονται με κάθε έναν.

1. Ξεκινήστε να ασχολείστε με τις πρακτικές ανάπτυξης Python και λογισμικού

Θα θελήσετε να ξεκινήσετε αγκαλιάζοντας την Python, τη γλώσσα επιλογής για τους περισσότερους μηχανικούς μηχανικής μάθησης.

Η εύχρηστη γλώσσα σεναρίων είναι το εργαλείο επιλογής για τους περισσότερους μηχανικούς δεδομένων και επιστήμονες δεδομένων. Τα περισσότερα εργαλεία για δεδομένα έχουν κατασκευαστεί στο Python ή έχουν ενσωματωμένη πρόσβαση API για εύκολη πρόσβαση στο Python.

Ευτυχώς, η σύνταξη του Python είναι σχετικά εύκολη. Η γλώσσα έχει πολλούς πόρους τεκμηρίωσης και εκπαίδευσης. Περιλαμβάνει επίσης υποστήριξη για όλα τα είδη παραδειγμάτων προγραμματισμού από λειτουργικό προγραμματισμό έως αντικειμενοστραφή προγραμματισμό.

Το μόνο πράγμα που μπορεί να είναι λίγο δύσκολο να πάρει είναι η καρτέλα και το διάστημα που απαιτούνται για την οργάνωση και την ενεργοποίηση του κωδικού σας. Στην Python, ο κενός χώρος έχει μεγάλη σημασία.

Ως μηχανικός μηχανικής μάθησης, θα εργαζόσασταν σε μια ομάδα για τη δημιουργία σύνθετων, συχνά κρίσιμων αποστολών εφαρμογών. Επομένως, τώρα είναι μια καλή στιγμή για να ανανεώσετε τις βέλτιστες πρακτικές της μηχανικής λογισμικού.

Μάθετε να χρησιμοποιείτε συνεργατικά εργαλεία όπως το Github. Πάρτε τη συνήθεια να γράφετε διεξοδικές δοκιμές μονάδας για τον κωδικό σας χρησιμοποιώντας πλαίσια δοκιμών όπως η μύτη. Δοκιμάστε τα API σας χρησιμοποιώντας εργαλεία όπως ο Ταχυδρόμος. Χρησιμοποιήστε συστήματα CI όπως το Jenkins για να βεβαιωθείτε ότι ο κώδικάς σας δεν σπάει. Αναπτύξτε καλές δεξιότητες αναθεώρησης κώδικα για να συνεργαστείτε καλύτερα με τους μελλοντικούς τεχνικούς συναδέλφους σας.

Ένα πράγμα που πρέπει να διαβάσετε : Ποιο είναι το καλύτερο Python IDE για την επιστήμη δεδομένων; Κάντε μια γρήγορη ανάγνωση, ώστε να καταλάβετε σε ποιο σύνολο εργαλείων θέλετε να εργαστείτε για να εφαρμόσετε το Python σε σύνολα δεδομένων.

Χρησιμοποιώ τον ίδιο το Σημειωματάριο Jupyter, καθώς είναι προεγκατεστημένο με τις περισσότερες από τις σημαντικές βιβλιοθήκες επιστήμης δεδομένων που θα χρησιμοποιήσετε. Έρχεται με μια εύκολη, καθαρή διαδραστική διεπαφή που σας επιτρέπει να επεξεργαστείτε τον κώδικά σας εν κινήσει.

Το Jupyter Notebook διαθέτει επίσης επεκτάσεις που σας επιτρέπουν να μοιράζεστε εύκολα τα αποτελέσματά σας με τον κόσμο γενικά. Τα αρχεία που δημιουργούνται είναι επίσης εξαιρετικά εύκολο να χρησιμοποιηθούν στο Github.

Ένα πράγμα που πρέπει να κάνετε : Το Pandas Cookbook σας επιτρέπει να διαλέξετε ζωντανά παραδείγματα του πλαισίου Pandas, μιας από τις πιο ισχυρές βιβλιοθήκες χειρισμού δεδομένων. Μπορείτε να επεξεργαστείτε γρήγορα ένα παράδειγμα για το πώς να παίξετε με ένα σύνολο δεδομένων μέσω αυτού.

2. Εξετάστε τα πλαίσια και τη θεωρία της μηχανικής μάθησης

Μόλις παίζετε με την Python και ασκείστε με αυτήν, ήρθε η ώρα να αρχίσετε να εξετάζετε τη θεωρία της μηχανικής μάθησης.

Θα μάθετε ποιοι αλγόριθμοι θα χρησιμοποιήσετε. Έχοντας μια βασική γνώση της θεωρίας πίσω από τη μηχανική μάθηση θα σας επιτρέψει να εφαρμόσετε μοντέλα με ευκολία.

Ένα πράγμα που πρέπει να διαβάσετε : Μια περιήγηση στους κορυφαίους δέκα αλγόριθμους για την αρχική εκμάθηση μηχανών θα σας βοηθήσει να ξεκινήσετε με τα βασικά. Θα μάθετε ότι δεν υπάρχει «δωρεάν γεύμα». Δεν υπάρχει αλγόριθμος που θα σας δώσει το βέλτιστο αποτέλεσμα για κάθε ρύθμιση, οπότε θα πρέπει να εμβαθύνετε σε κάθε αλγόριθμο.

Ένα πράγμα που πρέπει να κάνετε : Παίξτε με την διαδραστική δωρεάν μηχανική εκμάθηση στο μάθημα Python - αναπτύξτε τις δεξιότητές σας στο Python και αρχίστε να εφαρμόζετε αλγόριθμους.

3. Ξεκινήστε να εργάζεστε με σύνολα δεδομένων και πειραματιστείτε

Έχετε τα εργαλεία και τη θεωρία στη ζώνη σας. Θα πρέπει να σκεφτείτε να κάνετε μικρά μίνι-έργα που μπορούν να σας βοηθήσουν να βελτιώσετε τις δεξιότητές σας.

Ένα πράγμα που πρέπει να διαβάσετε : Ρίξτε μια ματιά σε 19 δωρεάν δημόσια σύνολα δεδομένων για το πρώτο σας έργο επιστήμης δεδομένων και ξεκινήστε να κοιτάτε πού μπορείτε να βρείτε διαφορετικά σύνολα δεδομένων στον ιστό για να παίξετε.

Ένα πράγμα που πρέπει να κάνετε : Τα σύνολα δεδομένων Kaggle θα σας επιτρέψουν να εργαστείτε με πολλά διαθέσιμα στο κοινό σύνολα δεδομένων. Αυτό που είναι ωραίο σε αυτήν τη συλλογή είναι ότι μπορείτε να δείτε πόσο δημοφιλή είναι ορισμένα σύνολα δεδομένων. Μπορείτε επίσης να δείτε ποια άλλα έργα έχουν κατασκευαστεί με το ίδιο σύνολο δεδομένων.

4. Κλιμάρετε τις δεξιότητές σας δεδομένων με Hadoop ή Spark

Τώρα που ασκείστε σε μικρότερα σύνολα δεδομένων, θα θελήσετε να μάθετε πώς να εργάζεστε με το Hadoop ή το Spark. Οι μηχανικοί δεδομένων συνεργάζονται με ροή, δεδομένα σε πραγματικό χρόνο παραγωγής σε κλίμακα terabyte και μερικές φορές petabyte. Επιδεικνύστε μαθαίνοντας τον τρόπο σας μέσα από ένα μεγάλο πλαίσιο δεδομένων.

Ένα πράγμα που πρέπει να διαβάσετε : Αυτό το σύντομο άρθρο Πώς Hadoop και Spark Stack Up; θα σας βοηθήσει να περπατήσετε τόσο στο Hadoop όσο και στο Spark και πώς συγκρίνονται και αντιπαραβάλλονται μεταξύ τους.

Ένα πράγμα που πρέπει να κάνετε : Εάν θέλετε να ξεκινήσετε να εργάζεστε αμέσως με ένα μεγάλο πλαίσιο δεδομένων, τα σημειωματάρια Spark Jupyter που φιλοξενούνται στο Databricks προσφέρουν μια εισαγωγή σε επίπεδο σεμιναρίου στο πλαίσιο και σας κάνουν να εξασκηθείτε με παραδείγματα κώδικα σε επίπεδο παραγωγής.

5. Εργαστείτε με ένα πλαίσιο βαθιάς μάθησης όπως το TensorFlow

Έχετε ολοκληρώσει την εξερεύνηση αλγορίθμων μηχανικής εκμάθησης και συνεργάζεστε με τα διαφορετικά μεγάλα εργαλεία δεδομένων εκεί έξω.

Τώρα ήρθε η ώρα να αναλάβουμε ένα είδος ισχυρής μάθησης ενίσχυσης που ήταν το επίκεντρο των νέων εξελίξεων. Μάθετε το πλαίσιο TensorFlow και θα είστε στην αιχμή της εργασίας μηχανικής μάθησης.

Ένα πράγμα που πρέπει να διαβάσετε : Διαβάστε Τι είναι το TensorFlow; και κατανοήστε τι συμβαίνει κάτω από την κουκούλα όταν πρόκειται για αυτό το ισχυρό πλαίσιο βαθιάς μάθησης.

Ένα πράγμα που πρέπει να κάνετε : Το TensorFlow και η Deep Learning χωρίς διδακτορικό είναι ένα διαδραστικό μάθημα που έχει κατασκευαστεί από την Google και συνδυάζει τη θεωρία που τοποθετείται σε διαφάνειες με πρακτικά εργαστήρια με κώδικα.

6. Ξεκινήστε να εργάζεστε με μεγάλα σύνολα δεδομένων σε επίπεδο παραγωγής

Τώρα που έχετε εργαστεί με πλαίσια βαθιάς μάθησης, μπορείτε να αρχίσετε να εργάζεστε για μεγάλα σύνολα δεδομένων σε επίπεδο παραγωγής.

Ως μηχανικός μηχανικής μάθησης, θα λαμβάνετε πολύπλοκες μηχανικές αποφάσεις σχετικά με τη διαχείριση μεγάλων ποσοτήτων δεδομένων και την ανάπτυξη των συστημάτων σας.

Αυτό θα περιλαμβάνει τη συλλογή δεδομένων από API και απόξεση ιστού, βάσεις δεδομένων SQL + NoSQL και όταν θα τα χρησιμοποιούσατε, χρήση πλαισίων αγωγών όπως Luigi ή Airflow.

Όταν αναπτύσσετε τις εφαρμογές σας, ενδέχεται να χρησιμοποιήσετε συστήματα που βασίζονται σε κοντέινερ, όπως το Docker για επεκτασιμότητα και αξιοπιστία και εργαλεία όπως το Flask για τη δημιουργία API για την εφαρμογή σας.

Ένα πράγμα που πρέπει να διαβάσετε : 7 τρόποι χειρισμού μεγάλων αρχείων δεδομένων για μηχανική εκμάθηση είναι μια ωραία θεωρητική άσκηση για το πώς θα χειρίζεστε μεγάλα σύνολα δεδομένων και μπορεί να χρησιμεύσει ως μια εύχρηστη λίστα τακτικών για χρήση.

Ένα πράγμα που πρέπει να κάνετε : Διαθέσιμα στο κοινό Big Data Sets είναι μια λίστα με μέρη όπου μπορείτε να αποκτήσετε πολύ μεγάλα σύνολα δεδομένων - έτοιμα να εξασκήσετε τις νέες σας δεξιότητες μηχανικής δεδομένων.

7. Πρακτική, πρακτική, πρακτική, οικοδόμηση προς ένα χαρτοφυλάκιο και στη συνέχεια μια δουλειά

Τέλος, έχετε φτάσει σε ένα σημείο όπου μπορείτε να δημιουργήσετε μοντέλα μηχανικής μάθησης. Το επόμενο βήμα για να προωθήσετε τη σταδιοδρομία σας στη μηχανική μάθηση είναι να βρείτε δουλειά με μια εταιρεία που διαθέτει αυτά τα μεγάλα σύνολα δεδομένων, ώστε να μπορείτε να εφαρμόζετε τις δεξιότητές σας κάθε μέρα σε ένα πρωτοποριακό πρόβλημα μηχανικής μάθησης.

Ένα πράγμα που πρέπει να διαβάσετε : 41 βασικές ερωτήσεις συνέντευξης με μηχανική εκμάθηση (με απαντήσεις) θα σας βοηθήσουν να εξασκηθείτε στις γνώσεις που χρειάζεστε για να αποκτήσετε μια συνέντευξη μηχανικής μάθησης.

Ένα πράγμα που πρέπει να κάνετε : Βγείτε και βρείτε συναντήσεις που είναι αφιερωμένες στη μηχανική μάθηση ή τη μηχανική δεδομένων στο Meetup - είναι ένας πολύ καλός τρόπος για να συναντήσετε συναδέλφους στο χώρο και τους πιθανούς διευθυντές προσλήψεων.

Ας ελπίσουμε ότι αυτό το σεμινάριο βοήθησε στη μείωση της δημοσιότητας γύρω από το AI σε κάτι πρακτικό και προσαρμοσμένο που μπορείτε να χρησιμοποιήσετε. Εάν αισθάνεστε σαν να χρειάζεστε λίγο περισσότερο, η εταιρεία με την οποία συνεργάζομαι, το Springboard, προσφέρει ένα bootcamp κομματιού σταδιοδρομίας αφιερωμένο στην AI και τη μηχανική μάθηση με εγγύηση εργασίας και 1: 1 καθοδήγηση από ειδικούς μηχανικής μάθησης.