Jump to content
Българският форум за музиканти

AI софтуерни решения за аудио обработка


Recommended Posts

23 hours ago, CyberGene said:

Прогнозата ми е, че ще се върнем към живата музика, изпълнявана от музиканти и това ще се оценява най-много. Компютрите отдавна са по-добри от човека  на шах, ама все още има турнири по шах за хора 😀

Така че, свирете и се упражнявайте. Само така ще направите нещо, което евентуално може да бъде оценено и да ви донесе удоволствие.

Стигнах до същия извод.
Преди доста време ми беше мания полифоничното (пръстово) свирене на китара.
Тъй като не намирах достатъчно интересни ноти, които да бъдат по силите ми,
(и не изглеждаше да мога да композирам нещо особено) реших да пиша програми,
които композират кратки пиески.

Основните принципи бяха такива:
избрах си определена проста форма - канон (от 2 до 4 гласа),
задавах последователност от акорди (хармонични функции) към които да се придържат гласовете,
последователност от силни и слаби метрични моменти, синкопи, определен звукоред, тоналност,
правила за гласоводене (от учебниците по полифония).
В рамките на зададените правила програмата построява различни случайни вариации и пише нотите.
 
Това не може да се нарече изкуствен интелект,
но бях много изненадан когато разсвирих някои от първите получени композицийки
- увличаха ме и в тях се усещаше някакво чувство, което не се знаеше от къде се е взело и не го бях предвидил.
 
Стигнах до мнението, че музиката е нещо като природна стихия, която може да се прояви
не само чрез човека, но и по друг начин.
И в крайна сметка, ако най-важното е да се получи интересна музика,
няма значение дали я е написал човек или компютър.

Сега вече не придавам значение на подобни компютърни експерименти.
Повече ценя свободната импровизация и търсенето на собствен стил.

Друг въпрос е за отношението към автора и слушателя.
Когато например един учен открива природните закони,
той не казва "аз съм велик творец и написах този природен закон",
а по-умерено - "открих този природен закон, който съществува"

Защо и за музиката да не се казва така: "авторът намери, откри тази интересна музика".

Ако изкуственият интелект може да замени композитора,
със сигурност няма смисъл да бъде написана и програма, която да замени слушателя -
един изкуствен интелект да пише музика, а друг изкуствен интелект да я слуша,
а пък хората да бъдат изолирани (не).

 

Адрес на коментара
Сподели в други сайтове

3 hours ago, Baby Thomas said:

Преди 2-3 месеца ръчках за софтуери, разделящи песен на тракове. Най-добре се справя demucs, което е фрий приложение, но май напускаха някакви платени, използващи алгоритъма му. По-добре се справя от гореизброените и Moises, а вероятно и от разни други. Но вече може да има по-добри, с тея темпове... ;)

Последният ъпдейт на Logic Pro 11 от преди месец го прави това и чувам, че се справял отлично, нарича се Stem Splitter:

https://www.apple.com/newsroom/2024/05/logic-pro-takes-music-making-to-the-next-level-with-new-ai-features/

(Скролирай до съответната секция, където го обясняват), ето и от менюала:

https://support.apple.com/guide/logicpro/extract-vocal-instrumental-stems-stem-lgcp61bae908/mac

Ако не се лъжа, се изисква да имаш Apple Silicon процесор, за да работи това, защото само те имат специализирани AI ядра. Аз се ъпдейтнах (то е безплатен ъпдейт) и съм на M2 процесор, но подобни функции за разделяне на тракове никога не са ме вълнували, затова не съм го и пробвал. Ако ти е интересно и нямаш Apple Silicon, за да го тестваш, прати някой трак и ще го пусна през моя Лоджик да видим какво ще се получи.

Адрес на коментара
Сподели в други сайтове

On 6/18/2024 at 2:41 PM, yamaha said:

А относно скоростта на развитието на технологията ти гарантирам, че още следващата година няма да може да отличиш кое е писано от човек и кое от AI - просто много бързо се учи тая гад (AI-то). :ph34r:

https://arxiv.org/abs/2405.08007
 

Вече неотличимо при езиковите модели, така че и според мен до година-две ще има успехи и при музикално-езиковите 😀 или май емотиконът е: 😕

Просто никой не се занимаваше сериозно с музикални модели досега, защото музиката е “ташак” работа, става само за иху-аху, сравнена с генерирането на текстово съдържание и комуникация, което е мощен помощник в почти всякакви бизнеси, а отделно и в геополитика и какво ли още не. 

Адрес на коментара
Сподели в други сайтове

1 hour ago, CyberGene said:

Последният ъпдейт на Logic Pro 11 от преди месец го прави това...

Почти всички вече го правят, дори ми се струва, че Лоджика доста е закъснял. :P И в това няма нищо чудно, тъй като повечето AI-алгоритми са open source. Щом и напълно безплатното Audacity вече го има като плъгин, че и се справя доста добре, за какво изобщо си говорим. ;)

 

audacity.jpg

Адрес на коментара
Сподели в други сайтове

3 minutes ago, yamaha said:

Почти всички вече го правят, дори ми се струва, че Лоджика доста е закъснял. :P

Е, сигурно, аз просто знам, че Бейби Томасчето е голям Епъл-фен и потребител на Лоджик 😀

Адрес на коментара
Сподели в други сайтове

А относно това, дето добави:

3 minutes ago, CyberGene said:

... защото музиката е “ташак” работа, става само за иху-аху...

За съжаление музиката винаги е била пренебрегвана, щото всеки мисли малко като във вица за Шаляпин, дето се качил на един файтон и кочияшът го попитал - "Ваша милост, какво работите?"....."- Ами, пея...", ......."- Абе то и аз пея като ми е тъжно, ама попитах какво работите...". ;)

Та така, всеки отстрани си мисли, че работата на другия е много лесна щото и той отбирал малко от нея, ама ще ми е много интересно ако един ден някой просто дръпне шалтера и целият свят остане без музика - какво ще правят радиата и телевизиите, какво ще прави филмовата индустрия, какво ще прави Епъл и всичките стрийминг платформи и разни други браншове, за които не се сещам в момента...

Адрес на коментара
Сподели в други сайтове

Не бийте вестоносеца 😀 Изкуственият интелект се прави от компании, в които се наливат много пари. Това е бизнес. На никого не му дреме за изкуството.

Адрес на коментара
Сподели в други сайтове

On 6/19/2024 at 9:21 PM, yamaha said:

... просто дръпне шалтера и целият свят остане без музика - какво ще правят радиата и телевизиите, какво ще прави филмовата индустрия ...

Предвид факта, че първобитният човек е бухал с пръчки и камъни по разни дънери и e бръмчал и сумтял, чисто като вътрешно търсене, което в последствие се е превърнало в ритъм/мелодийки, по-късно в хармония и т.н. според мен природата ще се погрижи отново да се стигне до някакъв прогрес, макар и не по същият начин, който знаем. Иначе по темата моето мнение е, че наистина тези модели стават все по-добри и по-добри и липсата на знания да се борави с тях единствено дърпа звукодизайнерите/продуцентите назад и забавя тяхната работа.

Според мен се получава нещо сходно на ситуацията в софтуерната индустрия – ChatGPT и другите му събратя могат да заменят най-елементарната работа на разни изключително посредствени специалисти от типа "обърни ми този JSON файл в YAML файл" или "изгенерирай ми още 10 тестови функции по зададения модел", но това не означава, че само с copy-paste и сляпо око/ръка трябва да ползваме всичко наготово от тях, без да е проверено, все пак да не забравяме, че механизмите им на работа са на принципа имитация на човешки интелект и в някои по-сложни и особени ситуации генерират простотии и грешки. Да не говорим, че те могат да генерират някакъв отговор спрямо подаденият вход и без липса на контекст в по-голямата екосистема на проекта стават безсмислени/излишни или пък в спешни/критични ситуации. Все ми се струва, че може би в близките 10 години големите фирми, които разполагат с ресурса да натренирват такива модели като ток/дисково пространство/изчислителна мощност и т.н. ще предлагат услуги, при които инженерите да качват целият си код там и натренираният модел да помага в решаването на по-сложни завъртяни казуси свързани с архитектура/натовареност/скалируемост и т.н. Интересен също е и правният въпрос доколко е позволено да се ползват подобни модели и дали частните фирми ще позволят да се качва информация там, защото засега моделите са огромна черна кутия – вкарваш нещо на входа, излиза нещо на изхода, къде обаче отива подадената информация и кой за какво я полазва – не е много ясно.

Та така и с музиката – какъвто и алгоритъм да се изгенерира за разделяне на инструментите или генериране на мелодии, винаги ще трябва някаква валидация от страна на човека за темпо/естественост/височина на тона/естетика и т.н. Просто ще се случи същото като при ИТ-тата, на пазара ще останат единствено онези, които имат знанията/уменията/гъвкавостта на усвоят това и да продължат да работят, другите конкуренцията ще ги измести, както и първите ще могат по-бързо да изтупват по-голям брой проекти/предизвикателства, както и спомена колегата @yamaha за случая "генерирай ми финалната фонова музика за тази пиеса". 

Адрес на коментара
Сподели в други сайтове

Докато се наканят и докато ги осъдят, те вече ще са научили всичко, дето им трябва. ;)

On 6/18/2024 at 2:41 PM, yamaha said:

...просто много бързо се учи тая гад (AI-то). :ph34r:

:greenball:

Адрес на коментара
Сподели в други сайтове

Абе не знам колко ще си платят ако съдът все пак одобри ония $150k на песен, за които се говори в статията, понеже между милионите песни, генерирани всеки ден, винаги може да се намери сходство на доста хиляди от тях с някои "човешки" написани песни, но пък е сравнително трудно доказуемо за всяка една от тях, та знам ли... ;)

Адрес на коментара
Сподели в други сайтове

Доказването може би може до някаква степен да се направи на Shazam-о подобен софтуер, който да разпознава някаква степен на прилика, в OCR света при документите този параметър се нарична confidence и се мери в проценти ... и все пак, ако има грешно разпознаване? Нали трябва човек да прослуша тези попадения и да отсече дали става/не става за дело. В странни времена живеем ... -_-

Адрес на коментара
Сподели в други сайтове

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Отговорете в темата...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Предишното ви съдържание бе възстановено.   Свободно редактиране

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Създай нов...

Важна информация!

Поставихме "бисквитки" на вашето устройство, за да направим този сайт по-добър. Можете да коригирате настройките си за "бисквитките" , в противен случай ще предположим, че сте съгласни с тяхното използване.