Методика шифрування даних на основі технології ідентифікації блоків матричним способом
DOI:
https://doi.org/10.32347/st.2025.3.1208Ключові слова:
матричний метод, сингулярний розклад, ідентифікація блоків даних, оптимізація обчислень, кластеризація, великі дані, кібербезпекаАнотація
У статті запропоновано матричний метод ідентифікації блоків даних на серверних платформах, які працюють із великими масивами інформації. Використання лінійної алгебри, зокрема сингулярного розкладу (SVD), дозволяє ефективно аналізувати структуру даних, зменшувати надлишковість та оптимізувати процес кластеризації. Запропонований метод включає попередню нормалізацію даних, обчислення косинусної міри подібності та адаптивний алгоритм обробки, що забезпечує високий рівень точності ідентифікації навіть при модифікації вхідних блоків. Досліджено обчислювальну складність алгоритму, показано переваги використання методів зменшення розмірності та оптимізації ресурсів. Проведені експериментальні дослідження довели ефективність методу в умовах високої варіативності даних, що дозволяє його застосовувати у кібербезпеці, хмарних обчисленнях і розподілених системах. Запропонований підхід зменшує час обробки запитів та підвищує точність ідентифікації, що критично важливо для моніторингу інформаційних потоків та забезпечення цілісності даних. Отримані результати підтверджують доцільність впровадження цього методу в інформаційних системах для підвищення продуктивності обробки великих даних.
Посилання
Averin S.V., Kovalchuk O.P. (2020). Metody obrobky ta analizu velykyh masyviv danyh: navch. posib. Kyi'v, Nauk. dumka, 312.
Glushkov V.M. (2019). Vvedennja v kibernetyku. Kyiv, Nauk dumka, 408.
Kovalenko I.V., Marchenko O.G. (2022). Teorija ta metody optymizacii' algorytmiv obrobky informacii. Dnipro, DNU, 297.
Grinchenko O.P., Romanov V.M. (2020). Metody identyfikacii danyh u rozpodilenyh systemah. Zaporizhzhja, ZNU, 198.
Kucenko L.V., Petrenko M.O. (2021). Informacijni tehnologii' analizu danyh: pidruchnyk, Harkiv: HNURE, 276. - (in Ukrainian).
Sydorenko P. I. (2018). Matrychni metody u prykladnyh zadachah analizu danyh. Lviv, LNU im. I. Franka, 235. (in Ukrainian).
Strang G. (2021). Introduction to Linear Algebra Gilbert Strang. Wellesley, MA: Wellesley-Cambridge Press, 568.
Kremin P.S., Olijnyk L.V. (2019). Analiz efektyvnosti algorytmiv poshuku shozhyh objektiv u velykyh danyh. Kyiv, IMB NAN Ukrai'ny, 314.
Golub G. H., Van Loan C. F. (2018). Matrix Computations. – Baltimore: Johns Hopkins University Press, 756.
Tang, J., & Li, T. (2018). Ensemble clustering. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 48(3), 410–422 https://doi.org/10.1109/TSMC.2016.2592904
Qi, Y., Guan, Y., & Wu, Y. (2022). Improving data reliability for deduplication storage in edge-cloud collaboration environment. Computers & Electrical Engineering, 101, 108032. https://doi.org/10.1016/j.compeleceng.2022.108032
Jolliffe I. T., Cadima J. (2016). Principal component analysis: a review and recent developments. Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences, 374(2065), 20150202. https://doi.org/10.1098/rsta.2015.0202
Kolda T. G., Bader B. W. (2009). Tensor decompositions and applications. SIAM Review, 51(3), 455–500. https://doi.org/10.1137/070701 11X
He Q., Li Z., Gao L., Gu Z., Zhong, Y. (2021). An Efficient Similarity-Aware Data Deduplication Scheme with Bloom Filter for Big Data Storage. IEEE Access, 9, 125066–125078. https://doi.org/10.1109/ACCESS.2021.3110280
Bishop C.M. (2019). Pattern Recognition and Machine Learning. New York, Springer, 738.
Chen, G., Guo, L., & Wang, M. (2022). An improved data deduplication approach for cloud storage. Concurrency and Computation: Practice and Experience, 34(7), e6735. https://doi.org/10.1002/cpe.6735
Ahmad, M., Bakar, A. A., & Yassin, W. (2020). Data Cleaning and Data Deduplication Framework for Big Data. Journal of Information and Communication Technology, 19(1), 87–108. https://doi.org/10.32890/jict2020.19.1.5
Shtandenko V.V. (2020). Optymizacija procedur zneosoblennja ta deduplikacii' danyh v informacijnyh systemah. Problemy programuvannja, 1–2, 119–133. https://doi.org/10.15407/pp2020. 01.119
Jin L., Li Y., Chen Z., Li K. (2020). Safe and Reliable Convergent Deduplication Scheme with Secure Re-Encryption for Big Data Storage in Cloud. IEEE Transactions on Big Data, 6(4), 752–763. https://doi.org/10.1109/TBDATA.2019.2938871
Luo C., Wang L., Zhou J. (2017). Chunk-level data deduplication for cloud storage. Concurrency and Computation: Practice and Experience, 29(16), e4202. https://doi.org/10.1002/cpe.4202
Dimopoulos T., Karras P., Vassiliadis, P. (2020). Incremental and robust parallel hierarchical clustering. Data Mining and Knowledge Discovery, 34(2), 351–402. https://doi.org/10.1007/s10618-019-00664-9
Gupta, L., Manikandan, N., & Sahu, R. (2019). A novel matrix based approach for dimensionality reduction in big data analytics. International Journal of Computational Intelligence Systems, 12(2), 1242–1253. https://doi.org/10.2991/ijcis.d. 190123.001
Hastie T., Tibshirani R., Friedman J. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction (2nd ed.). Springer. https://doi.org/10.1007/978-0-387-84858-7
Streng G. (2020). Linijna algebra ta navchannja na osnovi danyh (angl. Linear Algebra and Learning from Data). Wellesley-Cambridge Press. https://doi.org/10.2140/camcos.2018.13.1
Singh P., Reddy, P. (2020). Duplicate record detection in big data: a comprehensive study of data deduplication. International Journal of Computers and Applications, 42(4), 346–354.
https://doi.org/10.1080/1206212X.2018.1553828
Ishakov B.T. (2021). Metody zmenshennja rozmirnosti vektora oznak na bazi algorytmiv matrychnoi' faktoryzacii'. Systemy obrobky informacii', 5(169), 55–64. (Ukrainian). https://doi.org/10.30748/soi.2021.169.07
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2025 Oleksandr Levkusha, Yuriy Pepa

Ця робота ліцензується відповідно до Creative Commons Attribution-NonCommercial 4.0 International License.
Автор(и) та Редакція згодні на те, що Редакція також матиме право:
- здійснювати необхідне оформлення Твору/Статті за результатами його редакційної обробки;
- визначати самостійно кількість видань, друк додаткових копій і тираж Твору/Статті, кількість копій окремих видань і додаткових тиражів;
- опублікування Твору/Статті в інших виданнях, пов’язаних з діяльністю Редакції
В журналі діє ліцензія CC BY 4.0