Το Shotcut 25.10 έρχεται με τοπική τεχνητή νοημοσύνη, HTML και εγγενή καταγραφή

  • Τοπική μετατροπή κειμένου σε ομιλία με KokoroDoki και υποστήριξη CPU/GPU μέσω Docker.
  • Γεννήτρια HTML και φίλτρο "Γραφομηχανής" με προεπιλογές, διαφάνεια και όριο 15 FPS.
  • Εγγενής εγγραφή οθόνης από περιβάλλον (FFmpeg, GNOME, Spectacle ή OBS).
  • Ενημέρωση σε FFmpeg 8, ανανεωμένες βιβλιοθήκες και αρκετές βασικές διορθώσεις.

Shotcut 25.10

Το πιο γνωστό πρόγραμμα επεξεργασίας βίντεο ανοιχτού κώδικα σε επιφάνεια εργασίας Linux Κάνει άλλη μια κίνηση.. Shotcut 25.10 Είναι ήδη εδώ και διαθέτει λειτουργίες που στοχεύουν άμεσα στην παραγωγικότητα: τοπική τεχνητή νοημοσύνη, γεννήτριες HTML για κομψούς τίτλους και εγγενή εγγραφή οθόνης που αποφεύγει την εξάρτηση από εξωτερικά βοηθητικά προγράμματα.

Μετά από μια περίοδο δοκιμών beta, η κυκλοφορία ως σταθερή έκδοση επιβεβαιώνει ότι το έργο προχωρά σταθερά σύμφωνα με τον οδικό του χάρτη. Η κορυφαία καινοτομία είναι η μετατροπή κειμένου σε ομιλία (TTS) για σημειώσεις και υπότιτλους, συνοδευόμενο από φίλτρο γραφομηχανής, γεννήτρια εικόνας/βίντεο από HTML και την ενημέρωση σε FFmpeg 8, χωρίς να ξεχνάμε ένα καλό πακέτο διορθώσεων και βελτιώσεων συμβατότητας.

Επισκόπηση: Τι αλλάζει στο Shotcut 25.10

Η ομάδα ενσωματώνει λειτουργίες τεχνητής νοημοσύνης τον τελευταίο καιρό: πρώτα ήρθε η μεταγραφή με το Whisper (φωνή σε κείμενο) και τώρα ο κύκλος ολοκληρώνεται με ενσωματωμένο και τοπικό κείμενο σε ομιλίαΑυτός ο συνδυασμός ανοίγει πολύ ισχυρές ροές εργασίας για αφήγηση, υπότιτλους και προσβασιμότητα περιεχομένου χωρίς να χρειάζεται να φύγετε από τον επεξεργαστή.

Μαζί με την Τεχνητή Νοημοσύνη, αυτή η έκδοση παρουσιάζει δημιουργικά εργαλεία που υποστηρίζονται από HTML και λειτουργίες που ζητούνται από την κοινότητα, όπως η εγγραφή οθόνης σε πολλαπλές πλατφόρμες. Η έκδοση βελτιώνει επίσης την τεχνική βάση με ενημερωμένο FFmpeg 8 και βιβλιοθήκες κλειδιών.

Το Shotcut 25.10 εισάγει τοπική μετατροπή κειμένου σε ομιλία για σημειώσεις και υπότιτλους

Η εφαρμογή του TTS στο Shotcut βασίζεται σε Το KokoroDoki και το μοντέλο Kokoro 82MΕίναι μια μηχανή σύνθεσης ομιλίας ανοιχτού κώδικα που μπορεί να λειτουργεί σε πραγματικό χρόνο. Αξίζει να σημειωθεί ότι η έκδοση 25.07 ενσωμάτωνε ένα μοντέλο ομιλία σε κείμενοΤο πιο αξιοσημείωτο χαρακτηριστικό είναι ότι όλα συμβαίνουν στον υπολογιστή σας: δεν υπάρχει μετάδοση στο cloud, επομένως το απόρρητο και ο έλεγχος του έργου είναι εγγυημένα.

Για να επιταχυνθεί η επεξεργασία, Το KokoroDoki μπορεί να χρησιμοποιήσει CPU ή GPU NVIDIA με CUDA.Σε μηχανήματα με συμβατές κάρτες γραφικών, θα παρατηρήσετε σημαντικά μικρότερους χρόνους δημιουργίας, κάτι που εκτιμάται κατά την επανάληψη πολλών γραμμών υπότιτλων ή κατά την προετοιμασία μεγάλων ηχητικών αποσπασμάτων.

Όσον αφορά τις φωνές, το τρέχον πακέτο είναι πιο ολοκληρωμένο στα Αγγλικά. Τα αμερικανικά αγγλικά έχουν περισσότερες από είκοσι φωνές.Η βρετανική έκδοση προσφέρει περίπου οκτώ γλώσσες και η κάλυψη για άλλες γλώσσες είναι προς το παρόν πιο περιορισμένη. Αναμένεται ότι το εύρος θα επεκταθεί σε μελλοντικές αναθεωρήσεις, αλλά αρχικά υπάρχει ήδη αρκετό υλικό για μοντέλα, πρωτότυπα και τελικά έργα στα αγγλικά.

Υπάρχει μια τεχνική λεπτομέρεια που πρέπει να έχετε κατά νου: Η ενσωμάτωση πραγματοποιείται χρησιμοποιώντας το Docker.Αυτό προσθέτει ένα επιπλέον βήμα στη ρύθμιση σε σύγκριση με άλλες λειτουργίες, ειδικά αν δεν έχετε ξαναχρησιμοποιήσει ποτέ κοντέινερ. Δεν αποτελεί ανυπέρβλητο εμπόδιο, αλλά αξίζει να αφιερώσετε λίγα λεπτά για να τα βελτιστοποιήσετε όλα.

Shotcut 25.10, δημιουργία από HTML και εφέ γραφομηχανής

Η δημιουργικότητα επεκτείνεται με δύο συνεισφορές που συμβαδίζουν: μια νέα Γεννήτρια "Εικόνας/Βίντεο από HTML" και ένα εφέ κειμένου που προσομοιώνει μια γραφομηχανή. Η προσέγγιση είναι σαφής: να φέρουμε τις δυνατότητες του προγράμματος περιήγησης στη χρονογραμμή για να δημιουργήσουμε τίτλους, λεζάντες και κινούμενα σχέδια με διαφανές φόντο και χωρίς ασυνήθιστα πρόσθετα.

Η γεννήτρια HTML δημιουργεί Εικόνες ή κλιπ με προεπιλεγμένη διαφάνειαΓια να διατηρηθεί η σταθερότητα, τα βίντεο που δημιουργούνται περιορίζονται σε 15 καρέ ανά δευτερόλεπτο, μια επαρκής τιμή για γραφικά και επικαλύψεις που αποφεύγει τα σημεία συμφόρησης. Το αποτέλεσμα είναι άμεσα ορατό. Ανοίγει αυτόματα στο πρόγραμμα προβολής Origin μαζί με το HTML του, ώστε να μπορείτε να ελέγξετε ή να τροποποιήσετε τον κώδικα εν κινήσει.

Το εφέ "Κείμενο: Γραφομηχανή" περιλαμβάνει έτοιμες προς χρήση προεπιλογές και άλλες σχεδιασμένες για προσαρμογή. Μεταξύ των προφίλ που περιλαμβάνονται είναι: τρισδιάστατη εικόνα, ελαστική πινελιά, διπλωμένη, χρυσό μέταλλο o ώρα για πάρτυΑυτά τα εργαλεία καλύπτουν τα πάντα, από συμπαγή φινιρίσματα εικόνας μέχρι πιο παιχνιδιάρικες κινούμενες εικόνες βίντεο. Εάν είστε εξοικειωμένοι με το CSS και το JS, έχετε την ευκαιρία να δημιουργήσετε πολύ σοβαρά έργα.

  • Συμβατότητα με Κώδικας που μεταγλωττίστηκε από το CodePen, ιδανικό για την επαναχρησιμοποίηση αποσπασμάτων και σχεδίων που έχετε ήδη στο απόθεμά σας.
  • Απόδοση με όριο 15 FPS για σταθερότητα στη δημιουργία βασισμένη σε πρόγραμμα περιήγησης.
  • Δημιουργικές δυνατότητες με διαφανές υπόβαθρο χωρίς περίπλοκες συνθέσεις.

Εγγενής και διαπλατφορμική εγγραφή οθόνης

Ένα ακόμη κλασικό αίτημα της κοινότητας έφτασε επιτέλους: ενσωματωμένη εγγραφή οθόνηςΗ υλοποίηση ποικίλλει ανάλογα με το περιβάλλον, αλλά σε όλες τις περιπτώσεις έχει επιδιωχθεί το πιο αξιόπιστο εγγενές backend για τη μείωση των τριβών.

  • X11- Χρήση του FFmpeg ως κύριου backend.
  • Γουέιλαντ (GNOME): ενσωμάτωση με το εγγενές εργαλείο καταγραφής/μετάδοσης οθόνης.
  • Πλάσμα KDE: υποστήριξη στο Spectacle για σύλληψη.
  • AlternativaΑν δεν ισχύει τίποτα από τα παραπάνω, τότε καταφύγετε σε OBS Studio ως wild card.

Αυτό αποφεύγει την εγκατάσταση πρόσθετων βοηθητικών προγραμμάτων στις περισσότερες περιπτώσεις και ενοποιεί τη ροή εργασίαςΗχογραφείτε, επεξεργάζεστε και εξάγετε όλα από την ίδια εφαρμογή. Για τους δημιουργούς εκπαιδευτικών σεμιναρίων, κριτικών λογισμικού ή εκπαιδευτικών συνεδριών, αυτή είναι μια βελτίωση που είναι αισθητή από την πρώτη κιόλας μέρα.

Το Shotcut 25.10 ενημερώνει τη μηχανή πολυμέσων: FFmpeg 8 και βιβλιοθήκες

Υπάρχει επίσης κίνηση στο εσωτερικό. Η εφαρμογή μεταβαίνει σε FFmpeg 8Αυτό σημαίνει βελτιώσεις στην κωδικοποίηση/αποκωδικοποίηση, νέα φίλτρα και ευρύτερη συμβατότητα με τις σύγχρονες μορφές. Σε πρακτικό επίπεδο, αυτό μεταφράζεται σε πιο συνεπείς εξαγωγές και ομαλότερη αναπαραγωγή σύνθετων έργων.

Επίσης, ενημερώνονται βασικά στοιχεία, όπως π.χ. SVT-AV1, libaom, dav1d, libvpx, libwebp y ψιθυρίζω.cppΑυτά τα κομμάτια επηρεάζουν τους κωδικοποιητές AV1, VP9, ​​​​WebP ή την ίδια την μεταγραφή AI, κλείνοντας τον κύκλο για πιο ισχυρές ροές εργασίας.

Βελτιώσεις στη διεπαφή και τη ροή εργασίας του Shotcut 25.10

Μικρές λεπτομέρειες που αθροίζονται: οι επιλογές είναι πλέον διαθέσιμες στον πίνακα Ιδιότητες "Άνοιγμα με" και "Επαναφόρτιση"Αυτές είναι μέτριες αλλά πρακτικές αλλαγές όταν χρειάζεται να ανανεώσετε εξωτερικά επεξεργασμένα μέσα ή να τα εκκινήσετε γρήγορα με μια εφαρμογή συστήματος.

Το νέο Γεννήτρια "Εικόνας/Βίντεο από HTML" Συνυπάρχει με το φίλτρο "Κείμενο: Γραφομηχανή", ώστε να μπορείτε συνδυάστε τη δημιουργία HTML εκτός της χρονογραμμής (ως στοιχείο πολυμέσων) με την κινούμενη εικόνα της γραφομηχανής εφαρμοσμένη σε ένα ήδη εισαγόμενο κλιπ. Πλήρης ευελιξία ανάλογα με την περίπτωση χρήσης.

Διορθώσεις σφαλμάτων Shotcut 25.10 και βελτιώσεις σταθερότητας

Η έκδοση διορθώνει αρκετά ενοχλητικά προβλήματα που είχαν αναφερθεί, παρόμοια με το ενημέρωση 25.08. Για παράδειγμα, Αποτυχίες εξαγωγής όταν το όνομα ή η διαδρομή περιείχε τον χαρακτήρα ampersand (&), ένα πιο συνηθισμένο πρόβλημα από ό,τι φαίνεται σε κοινόχρηστα έργα.

Λύνει επίσης ένα Πρόβλημα κατά την εκκίνηση του AppImage σε Linux όταν εγκαταστάθηκε το AppImageLauncher και διορθώθηκαν προηγμένα keyframes στο "Text: Rich" που δεν συμπεριφέρονταν όπως έπρεπε. Τελικά, ένα Σφάλμα στο κανάλι άλφα κατά την αποκωδικοποίηση βίντεο Ut, κλειδί για όσους εργάζονται με διαφάνεια σε επαγγελματικούς τομείς.

Εγκατάσταση και συμβατότητα

Για να διευκολύνει τη ζωή στο Linux, το έργο διανέμει ένα Universal AppImage το οποίο μπορείτε να κατεβάσετε και να εκτελέσετε χωρίς να εγκαταστήσετε εξαρτήσεις. Στην πράξη, αρκεί να του δώσετε δικαιώματα εκτέλεσης και τελειώσατε.

Όσον αφορά τη συμβατότητα, επιβεβαιώνεται η υποστήριξη για glibc 2.35 σε Ubuntu 22.04 LTSΕπομένως, καλύπτεται αυτή η έκδοση LTS. Οποιαδήποτε σύγχρονη διανομή με πυρήνας υψηλότερος από 5.10 Θα πρέπει να κυλήσει ομαλά, ενώ σε παλαιότερα συστήματα ίσως χρειαστεί να προσαρμόσετε βιβλιοθήκες.

Περιπτώσεις χρήσης: από δημιουργούς έως εκπαιδευτικούς και προγραμματιστές

Για όσους δημιουργούν περιεχόμενο στα μέσα κοινωνικής δικτύωσης ή στο YouTube, το πακέτο είναι τέλειο. Καταγράφετε την οθόνη χωρίς να φύγετε από τον επεξεργαστήΕφαρμόζετε κομψά εφέ κειμένου και δημιουργείτε συνθετικές φωνές για εισαγωγές, εξηγήσεις ή παροτρύνσεις για δράση χωρίς να χρειάζεται να αφηγείστε κάθε αλλαγή.

  • Εκπαιδευτικά βίντεο: ενσωματωμένη ηχογράφηση + σχολιασμοί TTS για δυναμικούς ρυθμούς.
  • ΠαρουσιάσειςΕπαγγελματικοί τίτλοι κινουμένων σχεδίων χωρίς επί πληρωμή πρόσθετα.
  • ΠροσιτότηταΣυνδυάζοντας το Whisper (φωνή σε κείμενο) και το TTS, μπορείτε να βελτιώσετε τους υπότιτλους και την αφήγηση.

Στην εκπαίδευση και την κατάρτιση, η αξία είναι σαφής: ηχογραφημένα μαθήματα, εκπαιδευτικά βίντεο και υποστηρικτικό υλικό με τοπικά δημιουργημένες ετικέτες και φωνητικές εντολές. Αρκετά φωνητικά προφίλ στα Αγγλικά επιτρέπουν την ποικιλία του τόνου ανάλογα με το κοινό.

  • Επιδείξεις λογισμικούΕγγενής καταγραφή εφαρμογών χωρίς να βασίζεστε σε εξωτερικά εργαλεία.
  • Οπτική τεκμηρίωσηΒίντεο με τεχνικές σχολιασμούς και ευανάγνωστες εκρήξεις κειμένου.
  • Δοκιμή διεπαφής: καταγραφή και αναθεώρηση ροών εργασίας για γρήγορη ανατροφοδότηση.

Γρήγορη σύγκριση με την προηγούμενη έκδοση

Σε σύγκριση με την προηγούμενη έκδοση, οι βελτιώσεις είναι σημαντικές. Η εγγενής ηχογράφηση Εξαλείφει την ανάγκη για πρόσθετες λύσεις στους περισσότερους επιτραπέζιους υπολογιστές και ο συνδυασμός HTML+Typewriter πολλαπλασιάζει τις επιλογές για τίτλους και κάτω τρίτα.

  • Ενσωματωμένη εγγραφή χωρίς να περάσετε από το OBS (εκτός από εναλλακτικά σενάρια).
  • Προηγμένα εφέ κειμένου με υποστήριξη HTML/CSS και προεπιλογές ποιότητας.
  • Κείμενο σε ομιλία για σημειώσεις και υπότιτλους μέσα στο ίδιο το Shotcut.
  • FFmpeg 8 για καλύτερη απόδοση και τρέχουσες μορφές.
  • Ενισχυμένη σταθερότητα με διορθώσεις σε κοινές περιπτώσεις ακμής.

Απαιτήσεις και συνιστώμενη διαμόρφωση

Για να κυλήσουν όλα ομαλά, είναι καλύτερο να στοχεύσετε σε μια ισορροπημένη ομάδα. Με 8 GB μνήμης RAM μπορείτε να εργαστείτεΑλλά αν εργάζεστε σε μεσαία/μεγάλα έργα, θα εκτιμήσετε το γεγονός ότι έχετε 16 GB.

  • CPU: τουλάχιστον 4 πυρήνες για εφέ και χαλαρές κωδικοποιήσεις.
  • RAMΕλάχιστη χωρητικότητα 8 GB, συνιστώμενη χωρητικότητα 16 GB.
  • GPUΣυμβατό με OpenGL 3.3+. Αν χρησιμοποιήσετε CUDA, θα επιταχύνει το TTS με το KokoroDoki.
  • αποθήκευσηSSD για μέσα και προσωρινή μνήμη, ειδικά σε έργα με βαριούς κωδικοποιητές.

Στις ρυθμίσεις του έργου, είναι καλή ιδέα αντιστοίχιση FPS και ανάλυσης στον τελικό σας προορισμό για να αποφύγετε την περιττή αναπροσαρμογή κλίμακας. Η διατήρηση proxies και η βελτιστοποιημένη προεπισκόπηση θα σας γλιτώσουν από την καθυστέρηση κατά την προσθήκη φίλτρων και πολλαπλών κομματιών.

Ροές εργασίας με HTML, CodePen και Typewriter

Αν πρόκειται να πιέσετε πραγματικά τη γεννήτρια HTML, Δουλέψτε πάνω στο σχέδιο στον επεξεργαστή σας ή στο CodePen.Μεταγλωττίστε/συσκευάστε τους πόρους και επικολλήστε τους στο πρότυπο Shotcut. Αυτό διασφαλίζει ότι οι γραμματοσειρές, τα στυλ και τα σενάρια επιλύονται χωρίς εξωτερικές κλήσεις.

Για κινούμενα σχέδια κειμένου, εναλλάξτε το φίλτρο "Κείμενο: Γραφομηχανή" Και εξωτερική δημιουργία: όταν θέλετε ταχύτητα και κάτι ελαφρύ, το φίλτρο σας γλιτώνει από προβλήματα. αν χρειάζεστε σύνθετα φινιρίσματα, η ροή HTML θα σας δώσει περισσότερο έλεγχο (και εγγενή διαφάνεια).

Σημειώσεις σχετικά με την απόδοση, το απόρρητο και τα όρια

Η τοπική προσέγγιση στο TTS έχει δύο σημαντικά πλεονεκτήματα: προστατεύστε το περιεχόμενό σας Αποφεύγει την καθυστέρηση ή τις χρεώσεις online υπηρεσιών. Σε αντάλλαγμα, απαιτεί διαμόρφωση Docker και, για μέγιστη ταχύτητα, μια GPU NVIDIA με δυνατότητες CUDA.

Το όριο του 15 FPS σε παραγωγή HTML Δεν είναι απλώς μια ιδιοτροπία: σταθεροποιεί την απόδοση όταν η μηχανή του προγράμματος περιήγησης δημιουργεί βίντεο ή εικόνες με διαφάνειες και επίπεδα. Στην πράξη, είναι υπεραρκετό για τίτλους, μεταβάσεις και επικαλύψεις.

Μικρές λεπτομέρειες που κάνουν τη διαφορά

η επιλογή "Άνοιγμα με" στις Ιδιότητες Επιταχύνει την επεξεργασία ενός κλιπ σε ένα εξωτερικό εργαλείο και την επιστροφή στην προηγούμενη κατάσταση χωρίς να χάσετε το νήμα, ενώ "Επαναφόρτιση" Σας επιτρέπει να επιβάλλετε μια ενημέρωση πολυμέσων εάν το αρχείο έχει αλλάξει στον δίσκο. Αυτά τα δύο πλήκτρα, καθώς και το πρόγραμμα προβολής πηγαίου κώδικα που ανοίγει αυτόματα περιεχόμενο που δημιουργείται από HTML, κάνουν τις καθημερινές εργασίες πολύ πιο εύκολες.

Το άθροισμα του FFmpeg 8 και οι ανανεωμένες βιβλιοθήκες Μεταφράζεται επίσης σε ηρεμία: λιγότερες εκπλήξεις κατά την εισαγωγή/εξαγωγή και καλύτερος χειρισμός πρόσφατων μορφών όπως το AV1, μαζί με καλύτερη αποκωδικοποίηση.

Όσοι προέρχονται από προηγούμενες εκδόσεις θα βρουν έναν επεξεργαστή που Έχει ωριμάσει χωρίς να χάσει την ουσία τουΕίναι δωρεάν, λειτουργεί σε πολλαπλές πλατφόρμες και διαθέτει επιλογές τεχνικού σχεδιασμού που ευνοούν την τοπική ανάπτυξη. Η αίσθηση είναι ότι το έργο πιέζει το γκάζι εκεί που χρειάζεται: απόδοση, πρακτική τεχνητή νοημοσύνη και δημιουργικά εργαλεία με απαλές καμπύλες εκμάθησης.

Shotcut 25.05
σχετικό άρθρο:
Το Shotcut 25.05 προσθέτει βελτιώσεις στο HDR ενώ παράλληλα αναβαθμίζει το Qt στην έκδοση 6.8.3