Skip to content
Το Google Drive προσθέτει λειτουργία ηχητικής περίληψης για αρχεία PDF

Το Google Drive προσθέτει λειτουργία ηχητικής περίληψης για αρχεία PDF


Ιωάννα Κρητικού

Η Google προσθέτει περιλήψεις ήχου για αρχεία PDF στο Drive μέσω τεχνητής νοημοσύνης, με αποθήκευση αρχείου ήχου και αρχική διάθεση στην web έκδοση.

Η Google εισάγει στον χώρο του Drive μια λειτουργία που μετατρέπει μεγάλα αρχεία PDF σε σύντομα αποσπασματικά αρχεία ήχου, με στόχο να διευκολύνει την επεξεργασία εγγράφων. Η νέα υπηρεσία βασίζεται σε τεχνολογία από το NotebookLM της Google και δημιουργεί αρχείο ήχου που αποθηκεύεται στο λογαριασμό του χρήστη, δίνοντας έμφαση στην ταχύτητα πρόσβασης.

Το Google Drive προσθέτει λειτουργία ηχητικής περίληψης για αρχεία PDF

Τι είναι το NotebookLM

Πρόκειται για ένα εργαλείο της Google που προσεγγίζει την έρευνα με βάση το υλικό που του παρέχει ο χρήστης, αντί για γενικές απαντήσεις από ευρύ μοντέλο. Σε κάθε περίπτωση, το χαρακτηριστικό που επέτρεψε τη μεταφορά της ιδέας στο Drive ήταν τα Audio Overviews με την ιδιαιτερότητα της διαλόγου-μορφής αντί μονολόγου.

Το Google Drive προσθέτει λειτουργία ηχητικής περίληψης για αρχεία PDF

Σύμφωνα με πληροφορίες του SmartLife, η ιδέα των συνομιλητικών συνοψίσεων απέδωσε καλά στο περιβάλλον του NotebookLM και η Google αποφάσισε να ενσωματώσει μέρος της λειτουργικότητας στο Drive. Η προσέγγιση αυτή μειώνει τις παρεκκλίσεις των μοντέλων, αφού η ανάλυση περιορίζεται σε παρεχόμενες πηγές και όχι σε γενική γνώση.

Πώς λειτουργεί η περίληψη ήχου στο Drive

Στην web έκδοση του Drive εμφανίζεται ένας νέος κουμπί πάνω από την προεπισκόπηση PDF που επιτρέπει στο χρήστη να επιλέξει «Γεννήσει περίληψη ήχου», και η υπηρεσία αναλαμβάνει την ανάλυση του εγγράφου. Η διαδικασία καταλήγει στη δημιουργία ενός αρχείου ήχου το οποίο αποθηκεύεται στη ριζική θέση του Drive του χρήστη.

Το σύστημα εκτιμά αυτόματα το κατάλληλο μήκος για την περίληψη, παράγοντας αποσπάσματα που κυμαίνονται συνήθως από δύο έως δέκα λεπτά, ανάλογα με το μέγεθος και την πυκνότητα του PDF. Η επιλογή του χρόνου γίνεται με κριτήριο την πυκνότητα των πληροφοριών και το συνολικό μήκος του αρχείου, διασφαλίζοντας βασικές ενότητες του κειμένου.

Το Google Drive προσθέτει λειτουργία ηχητικής περίληψης για αρχεία PDF

Η λειτουργία είναι διαθέσιμη προς το παρόν μόνο στην έκδοση web του Drive, ενώ το παραγόμενο αρχείο δεν παίζει απευθείας ως προσωρινό στοιχείο αλλά αποθηκεύεται μόνιμα στον λογαριασμό. Αυτό διευκολύνει την περαιτέρω κοινή χρήση και διαχείριση του ήχου.

Προτεινόμενο Η Siri έχει ενσωματωθεί στις ρουτίνες ελέγχου του SmartThings Η Siri έχει ενσωματωθεί στις ρουτίνες ελέγχου του SmartThings

Περιορισμοί και διάθεση

Η ενσωμάτωση σε Drive αντιγράφει την ιδέα του NotebookLM χωρίς να προσφέρει όλη την διαδραστικότητα του αρχικού εργαλείου, καθώς ο χρήστης δεν μπορεί να κάνει ερωτήσεις μέσα στον ήχο ή να ζητήσει επεξηγήσεις επί του παραχθέντος αρχείου. Αυτή η απουσία διαδραστικής πλοήγησης αποτελεί τη σημαντικότερη λειτουργική διαφορά.

Επίσης, προς το παρόν δεν προβλέπεται αυτόματη συγχρονισμένη σήμανση της προόδου ακρόασης ή η παράλληλη παραγωγή πλήρους μεταγραφής του ήχου, λειτουργίες που υπάρχουν σε άλλες εφαρμογές απομαγνητοφώνησης. Η αρχική έκδοση παραδίδει μόνο το τελικό ηχητικό αρχείο χωρίς πρόσθετες μετα-πληροφορίες.

Η δυνατότητα θα είναι διαθέσιμη σε συνδρομητικές υπηρεσίες: αφορά μέλη του Google Workspace Enterprise και Education, ενώ για προσωπική χρήση απαιτείται πλάνο που περιλαμβάνει το Gemini Advanced, όπως το Google One AI Premium. Αυτή η πολιτική σημαίνει ότι δεν θα είναι άμεσα προσβάσιμη σε όλους τους χρήστες Gmail.

Επιπτώσεις στην καθημερινή χρήση

Για όσους διαχειρίζονται μεγάλο αριθμό τεχνικών εγγράφων ή ερευνητικών αναφορών, η μετατροπή σε συνοπτικό ηχητικό περιεχόμενο μπορεί να επιταχύνει την κατανάλωση πληροφορίας, ειδικά όταν ο χρόνος είναι περιορισμένος. Η δυνατότητα αυτή ενισχύει την πρόσβαση στις σημαντικές ενότητες χωρίς άνοιγμα πολλών εφαρμογών.

Παρά τους περιορισμούς, η προσέγγιση μετατρέπει το Drive από απλό χώρο αποθήκευσης σε πιο ενεργό εργαλείο παραγωγικότητας, με έμφαση στην άμεση πρόσβαση περιεχομένου. Μακροπρόθεσμα η λειτουργία ίσως επεκταθεί, αλλά προς το παρόν παραμένει μια επιλογή με συγκεκριμένες προδιαγραφές και συνδρομητική πρόσβαση.

Προτεινόμενα

  1. 1
    Η Sony παρουσίασε οθόνη PlayStation 27 ιντσών, προσανατολισμένη σε παίκτες υψηλών απαιτήσεων
  2. 2
    Η Ινδία έως το 2030 θα γίνει κόμβος για 2.400 παγκόσμια κέντρα ικανότητας
  3. 3
    Νέα έκδοση του Google Photos εισάγει το Nano Banana και περισσότερες λειτουργίες τεχνητής νοημοσύνης

Ροή Ειδήσεων

Προτεινόμενα