Модераторы: Daevaorn
  

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> сложение байт с использованием sse 
:(
    Опции темы
s_a_s_h_a
Дата 22.6.2011, 14:48 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 261
Регистрация: 20.7.2004
Где: Петрозаводск

Репутация: нет
Всего: 1



на вводе имеется две строки, каждая представляет из себя массив из 16-ти переменных типа BYTE. 
Например: 79040301052B0163A103400502060501 и F3A10340FFEC9754A103400502060501. Нужно с использованием sse сложить элементы из первого массива с соответствующими элементами из второго, т.е. 0x79+0xF3, 0x04+0xA1...
Посмотрел в сторону intrinsics, но там работа с 4 числами. В общем, буду признателен за кусок кода. 
PM MAIL   Вверх
xvr
Дата 22.6.2011, 15:06 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
****


Профиль
Группа: Комодератор
Сообщений: 7046
Регистрация: 28.8.2007
Где: Дублин, Ирландия

Репутация: 60
Всего: 223



Цитата(s_a_s_h_a @  22.6.2011,  14:48 Найти цитируемый пост)
Посмотрел в сторону intrinsics, но там работа с 4 числами. 

Угу, режте ваши 16 байтов на 4 куска по 4 и складывайте интринсиками

Или возьмите инструкцию PADDB (128 bit) - как раз на ваши 16 байтов

Интринсик (у Intel компилятора) - __m128i_mm_add_eip8(__m128i a, __m128i b);


PM MAIL   Вверх
s_a_s_h_a
Дата 22.6.2011, 15:43 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 261
Регистрация: 20.7.2004
Где: Петрозаводск

Репутация: нет
Всего: 1



xvr, за _mm_add_epi8 спасибо!
а вот про резать 16 байт на 4 куска и складывать я не понял.
PM MAIL   Вверх
xvr
Дата 22.6.2011, 16:20 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
****


Профиль
Группа: Комодератор
Сообщений: 7046
Регистрация: 28.8.2007
Где: Дублин, Ирландия

Репутация: 60
Всего: 223



Цитата(s_a_s_h_a @  22.6.2011,  15:43 Найти цитируемый пост)
а вот про резать 16 байт на 4 куска и складывать я не понял. 

4 раза по 32х битному слову
Код

char arg1[16];
char arg2[16];
char result[16];

for(int i=0;i<16;i+=4)
 *(int*)(result+i)=_mm_add32( *(int*)(arg1+i), *(int*)(arg2+i) );

Считаем, что ваша SSE команда _mm_add32 (или как она там называется), а массивы выровнены на 4 байта. int считаем 32 бита

PM MAIL   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
Правила форума "С++:Общие вопросы"
Earnest Daevaorn

Добро пожаловать!

  • Черновик стандарта C++ (за октябрь 2005) можно скачать с этого сайта. Прямая ссылка на файл черновика(4.4мб).
  • Черновик стандарта C (за сентябрь 2005) можно скачать с этого сайта. Прямая ссылка на файл черновика (3.4мб).
  • Прежде чем задать вопрос, прочтите это и/или это!
  • Здесь хранится весь мировой запас ссылок на документы, связанные с C++ :)
  • Не брезгуйте пользоваться тегами [code=cpp][/code].
  • Пожалуйста, не просите написать за вас программы в этом разделе - для этого существует "Центр Помощи".
  • C++ FAQ

Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, Earnest Daevaorn

 
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | C/C++: Общие вопросы | Следующая тема »


 




[ Время генерации скрипта: 0.0627 ]   [ Использовано запросов: 21 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.