Blame - common/OperationsUtils.cpp - platform/packages/modules/NeuralNetworks

2017-07-12 01:37:27 -0700

[diff] [blame]

/*

*

* Licensed under the Apache License, Version 2.0 (the "License");

5

* you may not use this file except in compliance with the License.

6

* You may obtain a copy of the License at

7

*

8

* http://www.apache.org/licenses/LICENSE-2.0

9

*

10

* Unless required by applicable law or agreed to in writing, software

11

* distributed under the License is distributed on an "AS IS" BASIS,

12

* WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

13

* See the License for the specific language governing permissions and

14

* limitations under the License.

15

*/

16

17

#define LOG_TAG "OperationsUtils"

18

19

#include "OperationsUtils.h"

Lev Proleev

0ca9520

2019-10-23 11:40:41 +0100

[diff] [blame]

#include <algorithm>

#include <cmath>

#include <limits>

#include <sstream>

#include <vector>

Slava Shklyaev

2020-12-10 16:55:55 +0000

[diff] [blame]

27

#include "LegacyUtils.h"

Miao Wang

2017-08-02 18:58:17 -0700

[diff] [blame]

28

#include "Operations.h"

Jean-Luc Brouillet

2017-07-12 01:37:27 -0700

[diff] [blame]

namespace android {

namespace nn {

Slava Shklyaev

2018-11-06 15:32:44 +0000

[diff] [blame]

33

namespace {

34

35

bool validateOperandTypes(const std::vector<OperandType>& expectedTypes, const char* tag,

36

uint32_t operandCount,

37

std::function<OperandType(uint32_t)> getOperandType) {

38

NN_RET_CHECK_EQ(operandCount, expectedTypes.size());

39

for (uint32_t i = 0; i < operandCount; ++i) {

40

OperandType type = getOperandType(i);

41

NN_RET_CHECK(type == expectedTypes[i])

Slava Shklyaev

daa4b51

2020-08-13 13:16:03 +0100

[diff] [blame]

42

<< "Invalid " << tag << " tensor type " << type << " for " << tag << " " << i

43

<< ", expected " << expectedTypes[i];

Slava Shklyaev

a694425

2018-11-06 15:32:44 +0000

[diff] [blame]

}

return true;

}

Lev Proleev

2019-10-23 17:24:57 +0100

[diff] [blame]

48

void CalculateActivationRangeImpl(int32_t activation, const Shape& outputShape, int32_t qmin,

49

int32_t qmax, int32_t* act_min, int32_t* act_max) {

50

const auto scale = outputShape.scale;

51

const auto zero_point = outputShape.offset;

52

53

auto quantize = [scale, zero_point](float f) {

54

return zero_point + static_cast<int32_t>(std::round(f / scale));

55

};

56

57

if (activation == kActivationRelu) {

58

*act_min = std::max(qmin, quantize(0.0));

59

*act_max = qmax;

60

} else if (activation == kActivationRelu6) {

61

*act_min = std::max(qmin, quantize(0.0));

62

*act_max = std::min(qmax, quantize(6.0));

63

} else if (activation == kActivationRelu1) {

64

*act_min = std::max(qmin, quantize(-1.0));

65

*act_max = std::min(qmax, quantize(1.0));

66

} else if (activation == kActivationNone) {

*act_min = qmin;

*act_max = qmax;

} else {

LOG(ERROR) << "Unsupported fused activation function.";

}

}

Slava Shklyaev

2018-11-06 15:32:44 +0000

[diff] [blame]

74

} // namespace

75

76

bool validateInputTypes(const IOperationValidationContext* context,

77

const std::vector<OperandType>& expectedTypes) {

78

return validateOperandTypes(expectedTypes, "input", context->getNumInputs(),

79

[context](uint32_t index) { return context->getInputType(index); });

80

}

81

82

bool validateOutputTypes(const IOperationValidationContext* context,

83

const std::vector<OperandType>& expectedTypes) {

84

return validateOperandTypes(

85

expectedTypes, "output", context->getNumOutputs(),

86

[context](uint32_t index) { return context->getOutputType(index); });

87

}

88

Michael Butler

83378c2

2020-11-02 23:17:11 -0800

[diff] [blame]

89

bool validateVersion(const IOperationValidationContext* context, Version contextVersion,

90

Version minSupportedVersion) {

91

if (contextVersion < minSupportedVersion) {

Slava Shklyaev

2019-09-30 16:04:43 +0100

[diff] [blame]

92

std::ostringstream message;

93

message << "Operation " << context->getOperationName() << " with inputs {";

94

for (uint32_t i = 0, n = context->getNumInputs(); i < n; ++i) {

95

if (i != 0) {

96

message << ", ";

97

}

Slava Shklyaev

daa4b51

2020-08-13 13:16:03 +0100

[diff] [blame]

98

message << context->getInputType(i);

Slava Shklyaev

2019-09-30 16:04:43 +0100

[diff] [blame]

99

}

100

message << "} and outputs {";

101

for (uint32_t i = 0, n = context->getNumOutputs(); i < n; ++i) {

102

if (i != 0) {

103

message << ", ";

104

}

Slava Shklyaev

daa4b51

2020-08-13 13:16:03 +0100

[diff] [blame]

105

message << context->getOutputType(i);

Slava Shklyaev

2019-09-30 16:04:43 +0100

[diff] [blame]

106

}

Michael Butler

d734100

2020-11-01 23:47:40 -0800

[diff] [blame]

107

message << "} is only supported since " << minSupportedVersion << " (validating using "

Michael Butler

83378c2

2020-11-02 23:17:11 -0800

[diff] [blame]

108

<< contextVersion << ")";

Slava Shklyaev

2019-09-30 16:04:43 +0100

[diff] [blame]

109

NN_RET_CHECK_FAIL() << message.str();

Slava Shklyaev

a694425

2018-11-06 15:32:44 +0000

[diff] [blame]

}

return true;

}

Jean-Luc Brouillet

2017-07-12 01:37:27 -0700

[diff] [blame]

114

bool SameShape(const Shape& in1, const Shape& in2) {

Miao Wang

2017-07-25 17:06:18 -0700

[diff] [blame]

115

if (in1.type != in2.type || in1.dimensions.size() != in2.dimensions.size()) {

Jean-Luc Brouillet

2017-07-12 01:37:27 -0700

[diff] [blame]

116

return false;

117

}

Miao Wang

2017-07-25 17:06:18 -0700

[diff] [blame]

118

for (size_t i = 0; i < in1.dimensions.size(); i++) {

Jean-Luc Brouillet

2017-07-12 01:37:27 -0700

[diff] [blame]

119

if (in1.dimensions[i] != in2.dimensions[i]) {

return false;

}

}

return true;

}

Miao Wang

2017-07-25 17:06:18 -0700

[diff] [blame]

126

bool SetShape(const Shape& in, Shape* out) {

Xusong Wang

603ebb6

2018-11-07 15:03:29 -0800

[diff] [blame]

127

if (in.type != out->type) {

Jean-Luc Brouillet

2017-07-12 01:37:27 -0700

[diff] [blame]

128

return false;

129

}

Miao Wang

2017-07-25 17:06:18 -0700

[diff] [blame]

130

out->dimensions = in.dimensions;

Jean-Luc Brouillet

2017-07-12 01:37:27 -0700

[diff] [blame]

return true;

}

uint32_t getNumberOfElements(const Shape& shape) {

135

uint32_t count = 1;

Miao Wang

2017-07-25 17:06:18 -0700

[diff] [blame]

136

for (size_t i = 0; i < shape.dimensions.size(); i++) {

Jean-Luc Brouillet

2017-07-12 01:37:27 -0700

[diff] [blame]

137

count *= shape.dimensions[i];

}

return count;

}

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

142

uint32_t getNumberOfElements(const Shape& shape, size_t firstAxisInclusive,

Slava Shklyaev

2018-09-17 11:58:40 +0100

[diff] [blame]

143

size_t lastAxisExclusive) {

Slava Shklyaev

2018-10-22 12:04:16 +0100

[diff] [blame]

144

nnAssert(0 <= firstAxisInclusive);

145

nnAssert(firstAxisInclusive <= lastAxisExclusive);

146

nnAssert(lastAxisExclusive <= shape.dimensions.size());

Slava Shklyaev

2018-09-17 11:58:40 +0100

[diff] [blame]

147

uint32_t count = 1;

148

for (size_t i = firstAxisInclusive; i < lastAxisExclusive; i++) {

149

count *= shape.dimensions[i];

}

return count;

}

Jean-Luc Brouillet

2017-07-25 00:17:50 -0700

[diff] [blame]

154

uint32_t getNumberOfDimensions(const Shape& shape) {

Miao Wang

2017-07-25 17:06:18 -0700

[diff] [blame]

155

return shape.dimensions.size();

Jean-Luc Brouillet

873c008

2017-07-25 00:17:50 -0700

[diff] [blame]

156

}

157

158

uint32_t getSizeOfDimension(const Shape& shape, uint32_t dimensionIdx) {

Slava Shklyaev

2018-10-22 12:04:16 +0100

[diff] [blame]

159

nnAssert(0 <= dimensionIdx && dimensionIdx < shape.dimensions.size());

Jean-Luc Brouillet

873c008

2017-07-25 00:17:50 -0700

[diff] [blame]

160

return shape.dimensions[dimensionIdx];

161

}

162

Lev Proleev

88a3bba

2020-03-18 15:20:46 +0000

[diff] [blame]

163

uint32_t hasKnownRank(const Shape& shape) {

164

return !shape.dimensions.empty();

165

}

166

Slava Shklyaev

2018-10-22 12:04:16 +0100

[diff] [blame]

167

bool handleNegativeAxis(int32_t numberOfDimensions, int32_t* axis) {

168

NN_CHECK(-numberOfDimensions <= *axis && *axis < numberOfDimensions);

169

if (*axis < 0) {

170

*axis += numberOfDimensions;

Slava Shklyaev

3970918

2018-09-27 18:25:43 +0100

[diff] [blame]

171

}

Slava Shklyaev

2018-10-22 12:04:16 +0100

[diff] [blame]

172

return true;

Slava Shklyaev

9057e9f

2018-09-27 15:13:47 +0100

[diff] [blame]

173

}

174

Lev Proleev

2019-10-23 17:24:57 +0100

[diff] [blame]

175

bool QuantizeMultiplier(double double_multiplier, int32_t* quantized_multiplier, int32_t* shift) {

Lev Proleev

1431a6f

2019-03-07 18:02:46 +0000

[diff] [blame]

176

if (double_multiplier == 0.) {

177

*quantized_multiplier = 0;

*shift = 0;

return true;

}

const double q = std::frexp(double_multiplier, shift);

182

auto q_fixed = static_cast<int64_t>(std::round(q * (1ll << 31)));

183

NN_RET_CHECK(q_fixed <= (1ll << 31));

184

if (q_fixed == (1ll << 31)) {

q_fixed /= 2;

++*shift;

}

NN_RET_CHECK_LE(q_fixed, std::numeric_limits<int32_t>::max());

Viet Dang

d0137f7

2019-12-04 16:18:08 +0000

[diff] [blame]

189

// A shift amount smaller than -31 would cause all bits to be shifted out

190

// and thus all results would be zero. We implement that instead with

191

// q_fixed==0, so as to avoid hitting issues with right-shift

192

// operations with shift amounts greater than 31. Note that this happens

193

// roughly when abs(double_multiplier) < 2^-31 and the present handling means

194

// that we're effectively flushing tiny double_multiplier's to zero.

195

// We could conceivably handle values in the range (roughly) [32, 63]

196

// as 'denormals' i.e. (shift==0, q_fixed < 2^30). In that point of view

197

// the present handling is just doing 'flush denormals to zero'. We could

198

// reconsider and actually generate nonzero denormals if a need arises.

if (*shift < -31) {

*shift = 0;

q_fixed = 0;

}

Lev Proleev

1431a6f

2019-03-07 18:02:46 +0000

[diff] [blame]

203

*quantized_multiplier = static_cast<int32_t>(q_fixed);

return true;

}

Lev Proleev

2019-10-23 17:24:57 +0100

[diff] [blame]

207

bool QuantizeMultiplierSmallerThanOneExp(double double_multiplier, int32_t* quantized_multiplier,

208

int32_t* left_shift) {

209

NN_RET_CHECK(double_multiplier > 0.);

210

NN_RET_CHECK(double_multiplier < 1.);

211

NN_RET_CHECK(QuantizeMultiplier(double_multiplier, quantized_multiplier, left_shift));

212

NN_RET_CHECK(*left_shift <= 0);

return true;

}

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

216

bool QuantizeMultiplierSmallerThanOne(double double_multiplier, int32_t* quantized_multiplier,

Miao Wang

2017-08-02 18:58:17 -0700

[diff] [blame]

217

int32_t* right_shift) {

Miao Wang

2017-09-21 17:04:31 -0700

[diff] [blame]

218

NN_OPS_CHECK(double_multiplier >= 0.);

219

NN_OPS_CHECK(double_multiplier < 1.);

Miao Wang

2017-08-02 18:58:17 -0700

[diff] [blame]

220

if (double_multiplier == 0.) {

221

*quantized_multiplier = 0;

222

*right_shift = 0;

Miao Wang

2017-09-21 17:04:31 -0700

[diff] [blame]

223

return true;

Miao Wang

2017-08-02 18:58:17 -0700

[diff] [blame]

224

}

Miao Wang

2017-09-21 17:04:31 -0700

[diff] [blame]

225

NN_OPS_CHECK(double_multiplier > 0.);

Miao Wang

2017-08-02 18:58:17 -0700

[diff] [blame]

226

const double q = std::frexp(double_multiplier, right_shift);

227

*right_shift *= -1;

Chih-Hung Hsieh

bafa138

2018-12-10 14:08:34 -0800

[diff] [blame]

228

int64_t q_fixed = static_cast<int64_t>(std::round(q * (1LL << 31)));

229

NN_OPS_CHECK(q_fixed <= (1LL << 31));

230

if (q_fixed == (1LL << 31)) {

Miao Wang

2017-08-02 18:58:17 -0700

[diff] [blame]

231

q_fixed /= 2;

232

--*right_shift;

233

}

Miao Wang

2017-09-21 17:04:31 -0700

[diff] [blame]

234

NN_OPS_CHECK(*right_shift >= 0);

235

NN_OPS_CHECK(q_fixed <= std::numeric_limits<int32_t>::max());

Miao Wang

2017-08-02 18:58:17 -0700

[diff] [blame]

236

*quantized_multiplier = static_cast<int32_t>(q_fixed);

Miao Wang

2017-09-21 17:04:31 -0700

[diff] [blame]

237

return true;

Miao Wang

2017-08-02 18:58:17 -0700

[diff] [blame]

238

}

239

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

240

bool QuantizeMultiplierGreaterThanOne(double double_multiplier, int32_t* quantized_multiplier,

Miao Wang

2017-08-02 18:58:17 -0700

[diff] [blame]

241

int* left_shift) {

Miao Wang

2017-09-21 17:04:31 -0700

[diff] [blame]

242

NN_OPS_CHECK(double_multiplier > 1.);

Miao Wang

2017-08-02 18:58:17 -0700

[diff] [blame]

243

const double q = std::frexp(double_multiplier, left_shift);

Chih-Hung Hsieh

bafa138

2018-12-10 14:08:34 -0800

[diff] [blame]

244

int64_t q_fixed = static_cast<int64_t>(std::round(q * (1LL << 31)));

245

NN_OPS_CHECK(q_fixed <= (1LL << 31));

246

if (q_fixed == (1LL << 31)) {

Miao Wang

2017-08-02 18:58:17 -0700

[diff] [blame]

247

q_fixed /= 2;

248

++*left_shift;

249

}

Miao Wang

2017-09-21 17:04:31 -0700

[diff] [blame]

250

NN_OPS_CHECK(*left_shift >= 0);

251

NN_OPS_CHECK(q_fixed <= std::numeric_limits<int32_t>::max());

Miao Wang

2017-08-02 18:58:17 -0700

[diff] [blame]

252

*quantized_multiplier = static_cast<int32_t>(q_fixed);

Miao Wang

2017-09-21 17:04:31 -0700

[diff] [blame]

253

return true;

Miao Wang

2017-08-02 18:58:17 -0700

[diff] [blame]

254

}

255

Przemyslaw Szczepaniak

fdfeec9

2019-05-02 10:03:44 +0100

[diff] [blame]

256

bool GetQuantizedConvolutionMultipler(const Shape& inputShape, const Shape& filterShape,

257

const Shape& biasShape, const Shape& outputShape,

258

double* multiplier) {

259

// Upcast bias and input_product to double

260

const double input_product_scale = inputShape.scale * filterShape.scale;

261

const double bias_scale = biasShape.scale;

Miao Wang

2017-08-02 18:58:17 -0700

[diff] [blame]

262

263

// The following conditions must be guaranteed by the training pipeline.

Miao Wang

2017-09-21 17:04:31 -0700

[diff] [blame]

264

NN_OPS_CHECK(std::abs(input_product_scale - bias_scale) <=

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

265

1e-6 * std::min(input_product_scale, bias_scale));

Miao Wang

2017-09-21 17:04:31 -0700

[diff] [blame]

266

NN_OPS_CHECK(input_product_scale >= 0);

Przemyslaw Szczepaniak

fdfeec9

2019-05-02 10:03:44 +0100

[diff] [blame]

267

*multiplier = input_product_scale / outputShape.scale;

Miao Wang

2017-09-21 17:04:31 -0700

[diff] [blame]

268

return true;

Miao Wang

2017-08-02 18:58:17 -0700

[diff] [blame]

269

}

270

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

271

void CalculateActivationRangeUint8(int32_t activation, const Shape& outputShape, int32_t* act_min,

Miao Wang

2017-08-02 18:58:17 -0700

[diff] [blame]

272

int32_t* act_max) {

273

const int32_t qmin = std::numeric_limits<uint8_t>::min();

274

const int32_t qmax = std::numeric_limits<uint8_t>::max();

275

Lev Proleev

2019-10-23 17:24:57 +0100

[diff] [blame]

276

CalculateActivationRangeImpl(activation, outputShape, qmin, qmax, act_min, act_max);

277

}

Miao Wang

2017-08-02 18:58:17 -0700

[diff] [blame]

278

Lev Proleev

2019-10-23 17:24:57 +0100

[diff] [blame]

279

void CalculateActivationRangeInt8(int32_t activation, const Shape& outputShape, int32_t* act_min,

280

int32_t* act_max) {

281

const int32_t qmin = std::numeric_limits<int8_t>::min();

282

const int32_t qmax = std::numeric_limits<int8_t>::max();

Miao Wang

2017-08-02 18:58:17 -0700

[diff] [blame]

283

Lev Proleev

2019-10-23 17:24:57 +0100

[diff] [blame]

284

CalculateActivationRangeImpl(activation, outputShape, qmin, qmax, act_min, act_max);

Miao Wang

658dc37

2017-12-14 15:01:31 -0800

[diff] [blame]

285

}

286

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

287

void CalculateActivationRangeFloat(int32_t activation, float* activation_min,

Miao Wang

658dc37

2017-12-14 15:01:31 -0800

[diff] [blame]

288

float* activation_max) {

289

if (activation == kActivationRelu) {

290

*activation_min = 0.f;

291

*activation_max = std::numeric_limits<float>::max();

292

} else if (activation == kActivationRelu6) {

293

*activation_min = 0.f;

294

*activation_max = 6.f;

295

} else if (activation == kActivationRelu1) {

296

*activation_min = -1.f;

297

*activation_max = 1.f;

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

298

} else if (activation == kActivationNone) {

Miao Wang

658dc37

2017-12-14 15:01:31 -0800

[diff] [blame]

299

*activation_min = std::numeric_limits<float>::lowest();

300

*activation_max = std::numeric_limits<float>::max();

301

} else {

302

LOG(ERROR) << "Unsupported fused activation function.";

Miao Wang

2017-08-02 18:58:17 -0700

[diff] [blame]

}

}

int32_t CalculateInputRadius(int input_integer_bits, int input_left_shift) {

307

const double max_input_rescaled = 1.0 * ((1 << input_integer_bits) - 1) *

Chih-Hung Hsieh

bafa138

2018-12-10 14:08:34 -0800

[diff] [blame]

308

(1LL << (31 - input_integer_bits)) /

309

(1LL << input_left_shift);

Miao Wang

2017-08-02 18:58:17 -0700

[diff] [blame]

310

// Tighten bound using floor. Suppose that we could use the exact value.

311

// After scaling the difference, the result would be at the maximum. Thus we

312

// must ensure that our value has lower magnitude.

313

return static_cast<int32_t>(std::floor(max_input_rescaled));

314

}

315

Xusong Wang

d0cc11f

2019-04-12 13:38:49 -0700

[diff] [blame]

316

void calculateExplicitPaddingImpl(int32_t in_size, int32_t stride, int32_t dilation_factor,

317

int32_t filter_size, int32_t padding_implicit,

318

bool isTransposeConv, int32_t* padding_head,

319

int32_t* padding_tail) {

*padding_head = 0;

*padding_tail = 0;

int32_t effective_filter_size = (filter_size - 1) * dilation_factor + 1;

324

325

if (padding_implicit == kPaddingSame) {

326

int32_t out_size = (in_size + stride - 1) / stride;

327

int32_t tmp = (out_size - 1) * stride + effective_filter_size;

328

if (tmp > in_size) {

329

*padding_head = (tmp - in_size) / 2;

330

*padding_tail = (tmp - in_size) - *padding_head;

331

}

332

// For transpose conv, make padding tail fit tightly to the end of the last stride.

333

if (isTransposeConv) {

334

*padding_tail = (tmp - in_size) - *padding_head;

}

}

}

Lev Proleev

2018-10-18 14:33:39 +0100

[diff] [blame]

339

bool calculateBroadcastedShape(const Shape& in1, const Shape& in2, Shape* out) {

Xusong Wang

ced4b70

2019-03-14 13:55:20 -0700

[diff] [blame]

340

NN_RET_CHECK(in1.type == in2.type);

Lev Proleev

8e3e09f

2018-10-18 14:33:39 +0100

[diff] [blame]

341

uint32_t numberOfDims1 = getNumberOfDimensions(in1);

342

uint32_t numberOfDims2 = getNumberOfDimensions(in2);

343

uint32_t maxDims = std::max(numberOfDims1, numberOfDims2);

344

out->dimensions = std::vector<uint32_t>(maxDims);

345

for (uint32_t i = 1; i <= maxDims; i++) {

346

uint32_t dim1 = 1;

347

if (i <= numberOfDims1) {

348

dim1 = getSizeOfDimension(in1, numberOfDims1 - i);

349

}

350

uint32_t dim2 = 1;

351

if (i <= numberOfDims2) {

352

dim2 = getSizeOfDimension(in2, numberOfDims2 - i);

353

}

354

if (dim1 != dim2 && dim1 != 1 && dim2 != 1) {

355

LOG(ERROR) << "Dimensions mismatch for broadcast:\n"

356

<< "First tensor: dimension " << numberOfDims1 - i << " of size " << dim1

David Gross

94597f0

2020-08-14 15:30:49 -0700

[diff] [blame]

357

<< "\nSecond tensor: dimension " << numberOfDims2 - i << " of size " << dim2;

Lev Proleev

8e3e09f

2018-10-18 14:33:39 +0100

[diff] [blame]

358

return false;

359

}

Xusong Wang

ced4b70

2019-03-14 13:55:20 -0700

[diff] [blame]

360

out->dimensions[maxDims - i] = (dim1 == 1) ? dim2 : dim1;

Lev Proleev

8e3e09f

2018-10-18 14:33:39 +0100

[diff] [blame]

}

return true;

}

Przemyslaw Szczepaniak

14c1213

2019-11-28 11:25:21 +0000

[diff] [blame]

365

template <>

366

uint8_t requantize<uint8_t>(uint8_t value, const Shape& oldShape, const Shape& newShape) {

Lev Proleev

5d7c6b4

2018-12-10 11:47:19 +0000

[diff] [blame]

367

double doubleValue = (value - oldShape.offset) * oldShape.scale;

Xusong Wang

9a8dde7

2019-04-24 12:49:07 -0700

[diff] [blame]

368

double doubleRet = doubleValue / newShape.scale + newShape.offset;

369

if (doubleRet < 0) return 0;

370

if (doubleRet > 255) return 255;

Xusong Wang

7c1bc2c

2019-05-30 18:23:33 -0700

[diff] [blame]

371

return static_cast<uint8_t>(std::round(doubleRet));

Lev Proleev

5d7c6b4

2018-12-10 11:47:19 +0000

[diff] [blame]

372

}

373

Przemyslaw Szczepaniak

14c1213

2019-11-28 11:25:21 +0000

[diff] [blame]

374

template <>

375

int8_t requantize<int8_t>(int8_t value, const Shape& oldShape, const Shape& newShape) {

Lev Proleev

0ca9520

2019-10-23 11:40:41 +0100

[diff] [blame]

376

double doubleValue = (value - oldShape.offset) * oldShape.scale;

377

double doubleRet = doubleValue / newShape.scale + newShape.offset;

378

if (doubleRet < -128) return -128;

379

if (doubleRet > 127) return 127;

380

return static_cast<int8_t>(std::round(doubleRet));

381

}

382

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

383

bool reshapePrepare(const Shape& input, const int32_t* targetDims, const int32_t targetDimsSize,

Miao Wang

2017-09-11 14:16:14 -0700

[diff] [blame]

384

Shape* output) {

385

// Reshape allows one of the targetDims components to have the

386

// special -1 value, meaning it will be calculated automatically based on the

387

// input. Here we calculate what that dimension should be so that the number

388

// of output elements in the same as the number of input elements.

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

389

int32_t numInputElements = (int32_t)getNumberOfElements(input);

Miao Wang

2017-09-11 14:16:14 -0700

[diff] [blame]

390

391

std::vector<uint32_t> outDims(targetDimsSize);

392

int32_t numOutputElements = 1;

393

int32_t strechDim = -1;

394

for (int32_t i = 0; i < targetDimsSize; ++i) {

395

int32_t value = targetDims[i];

396

if (value == -1) {

Miao Wang

2017-09-21 17:04:31 -0700

[diff] [blame]

397

NN_OPS_CHECK(strechDim == -1);

Miao Wang

2017-09-11 14:16:14 -0700

[diff] [blame]

398

strechDim = i;

399

} else {

400

numOutputElements *= value;

401

outDims[i] = (uint32_t)value;

402

}

403

}

404

if (strechDim != -1) {

405

int32_t strechValue = numInputElements / numOutputElements;

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

406

outDims[strechDim] = (uint32_t)strechValue;

Miao Wang

2017-09-11 14:16:14 -0700

[diff] [blame]

407

numOutputElements *= strechValue;

408

}

409

Miao Wang

2017-09-21 17:04:31 -0700

[diff] [blame]

410

NN_OPS_CHECK(numInputElements == numOutputElements);

Miao Wang

2017-09-11 14:16:14 -0700

[diff] [blame]

411

412

output->type = input.type;

413

output->dimensions = outDims;

414

output->offset = input.offset;

415

output->scale = input.scale;

return true;

}

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

420

bool depthToSpacePrepare(const Shape& input, int32_t blockSize, Shape* output) {

Miao Wang

2017-09-21 17:04:31 -0700

[diff] [blame]

421

NN_OPS_CHECK(getNumberOfDimensions(input) == 4);

422

NN_OPS_CHECK(blockSize > 0);

Miao Wang

2017-09-11 14:16:14 -0700

[diff] [blame]

423

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

424

uint32_t batches = getSizeOfDimension(input, 0);

425

uint32_t height = getSizeOfDimension(input, 1);

426

uint32_t width = getSizeOfDimension(input, 2);

Miao Wang

2017-09-11 14:16:14 -0700

[diff] [blame]

427

uint32_t channels = getSizeOfDimension(input, 3);

428

Miao Wang

2017-09-21 17:04:31 -0700

[diff] [blame]

429

NN_OPS_CHECK(channels % (blockSize * blockSize) == 0);

Miao Wang

2017-09-11 14:16:14 -0700

[diff] [blame]

430

output->type = input.type;

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

431

output->dimensions = {batches, height * blockSize, width * blockSize,

Miao Wang

2017-09-11 14:16:14 -0700

[diff] [blame]

432

channels / (blockSize * blockSize)};

433

output->offset = input.offset;

434

output->scale = input.scale;

return true;

}

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

439

bool spaceToDepthPrepare(const Shape& input, int32_t blockSize, Shape* output) {

Miao Wang

2017-09-21 17:04:31 -0700

[diff] [blame]

440

NN_OPS_CHECK(getNumberOfDimensions(input) == 4);

441

NN_OPS_CHECK(blockSize > 0);

Miao Wang

2017-09-11 14:16:14 -0700

[diff] [blame]

442

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

443

uint32_t batches = getSizeOfDimension(input, 0);

444

uint32_t height = getSizeOfDimension(input, 1);

445

uint32_t width = getSizeOfDimension(input, 2);

Miao Wang

2017-09-11 14:16:14 -0700

[diff] [blame]

446

uint32_t channels = getSizeOfDimension(input, 3);

447

Miao Wang

2017-09-21 17:04:31 -0700

[diff] [blame]

448

NN_OPS_CHECK(height % blockSize == 0);

449

NN_OPS_CHECK(width % blockSize == 0);

Miao Wang

2017-09-11 14:16:14 -0700

[diff] [blame]

450

451

output->type = input.type;

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

452

output->dimensions = {batches, height / blockSize, width / blockSize,

Miao Wang

2017-09-11 14:16:14 -0700

[diff] [blame]

453

channels * (blockSize * blockSize)};

454

output->offset = input.offset;

455

output->scale = input.scale;

return true;

}

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

460

bool embeddingLookupPrepare(const Shape& valueShape, const Shape& lookupShape, Shape* outputShape) {

Yang Ni

2017-09-27 10:26:52 -0700

[diff] [blame]

461

NN_OPS_CHECK(getNumberOfDimensions(valueShape) >= 2);

462

NN_OPS_CHECK(getNumberOfDimensions(lookupShape) == 1);

463

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

464

const uint32_t columns = getSizeOfDimension(valueShape, 1);

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

465

const uint32_t lookups = getSizeOfDimension(lookupShape, 0);

Yang Ni

2017-09-27 10:26:52 -0700

[diff] [blame]

466

467

outputShape->type = valueShape.type;

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

468

outputShape->dimensions = {lookups, columns};

Yang Ni

2017-09-27 10:26:52 -0700

[diff] [blame]

469

for (uint32_t i = 2; i < getNumberOfDimensions(valueShape); i++) {

Miao Wang

0cc3223

2017-10-09 10:43:21 -0700

[diff] [blame]

470

outputShape->dimensions.push_back(getSizeOfDimension(valueShape, i));

Yang Ni

2017-09-27 10:26:52 -0700

[diff] [blame]

471

}

472

outputShape->offset = valueShape.offset;

473

outputShape->scale = valueShape.scale;

return true;

}

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

478

bool hashtableLookupPrepare(const Shape& lookupShape, const Shape& keyShape,

479

const Shape& valueShape, Shape* outputShape, Shape* hitShape) {

Yang Ni

2017-09-27 10:26:52 -0700

[diff] [blame]

480

NN_OPS_CHECK(getNumberOfDimensions(lookupShape) == 1);

481

NN_OPS_CHECK(getNumberOfDimensions(keyShape) == 1);

482

NN_OPS_CHECK(getNumberOfDimensions(valueShape) >= 1);

483

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

484

const uint32_t lookups = getSizeOfDimension(lookupShape, 0);

Yang Ni

2017-09-27 10:26:52 -0700

[diff] [blame]

485

outputShape->type = valueShape.type;

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

486

outputShape->dimensions = {lookups};

Yang Ni

2017-09-27 10:26:52 -0700

[diff] [blame]

487

for (uint32_t i = 1; i < getNumberOfDimensions(valueShape); i++) {

Miao Wang

0cc3223

2017-10-09 10:43:21 -0700

[diff] [blame]

488

outputShape->dimensions.push_back(getSizeOfDimension(valueShape, i));

Yang Ni

2017-09-27 10:26:52 -0700

[diff] [blame]

489

}

490

outputShape->offset = valueShape.offset;

491

outputShape->scale = valueShape.scale;

492

493

hitShape->type = OperandType::TENSOR_QUANT8_ASYMM;

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

494

hitShape->dimensions = {lookups};

Yang Ni

2017-09-27 10:26:52 -0700

[diff] [blame]

495

hitShape->offset = 0;

496

hitShape->scale = 1.f;

return true;

}

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

501

bool padPrepare(const Shape& input, const int32_t* paddingsData, const Shape& paddingsShape,

Miao Wang

2018-01-21 02:39:41 -0800

[diff] [blame]

502

Shape* output) {

Miao Wang

2018-01-21 02:39:41 -0800

[diff] [blame]

503

uint32_t numInputDims = getNumberOfDimensions(input);

Miao Wang

2018-01-21 02:39:41 -0800

[diff] [blame]

504

505

// paddings need to be provided as a 2-D int32 tensor.

506

NN_OPS_CHECK(paddingsShape.type == OperandType::TENSOR_INT32);

507

NN_OPS_CHECK(getNumberOfDimensions(paddingsShape) == 2);

508

NN_OPS_CHECK(getSizeOfDimension(paddingsShape, 0) == numInputDims);

509

NN_OPS_CHECK(getSizeOfDimension(paddingsShape, 1) == 2);

510

511

std::vector<uint32_t> outDims(numInputDims);

512

for (uint32_t i = 0; i < numInputDims; ++i) {

513

int32_t beforePadding = *paddingsData++;

514

int32_t afterPadding = *paddingsData++;

515

// Pad value has to be greater than equal to 0.

516

NN_OPS_CHECK(beforePadding >= 0 && afterPadding >= 0);

517

outDims[i] = beforePadding + getSizeOfDimension(input, i) + afterPadding;

518

}

519

output->type = input.type;

520

output->dimensions = outDims;

521

output->offset = input.offset;

522

output->scale = input.scale;

return true;

}

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

527

bool batchToSpacePrepare(const Shape& input, const int32_t* blockSizeData,

528

const Shape& blockSizeShape, Shape* output) {

Miao Wang

2018-01-21 02:39:41 -0800

[diff] [blame]

529

// Only 4D NHWC tensors are supported.

530

NN_OPS_CHECK(getNumberOfDimensions(input) == 4);

531

532

// blockSize need to be provided as a 1-D int32 tensor.

533

NN_OPS_CHECK(blockSizeShape.type == OperandType::TENSOR_INT32);

534

NN_OPS_CHECK(getNumberOfDimensions(blockSizeShape) == 1);

535

// Only applies to spatial dimensions.

536

NN_OPS_CHECK(getSizeOfDimension(blockSizeShape, 0) == 2);

537

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

538

uint32_t batches = getSizeOfDimension(input, 0);

539

uint32_t height = getSizeOfDimension(input, 1);

540

uint32_t width = getSizeOfDimension(input, 2);

Miao Wang

2018-01-21 02:39:41 -0800

[diff] [blame]

541

uint32_t channels = getSizeOfDimension(input, 3);

542

543

NN_OPS_CHECK(batches % (blockSizeData[0] * blockSizeData[1]) == 0);

544

output->type = input.type;

545

output->dimensions = {batches / (blockSizeData[0] * blockSizeData[1]),

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

546

height * blockSizeData[0], width * blockSizeData[1], channels};

Miao Wang

2018-01-21 02:39:41 -0800

[diff] [blame]

547

output->offset = input.offset;

548

output->scale = input.scale;

return true;

}

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

553

bool spaceToBatchPrepare(const Shape& input, const int32_t* blockSizeData,

554

const Shape& blockSizeShape, const int32_t* paddingsData,

555

const Shape& paddingsShape, Shape* output) {

Miao Wang

2018-01-21 02:39:41 -0800

[diff] [blame]

556

// Only 4D NHWC tensors are supported.

557

NN_OPS_CHECK(getNumberOfDimensions(input) == 4);

558

559

// blockSize need to be provided as a 1-D int32 tensor.

560

NN_OPS_CHECK(blockSizeShape.type == OperandType::TENSOR_INT32);

561

NN_OPS_CHECK(getNumberOfDimensions(blockSizeShape) == 1);

562

// Only applies to spatial dimensions.

563

NN_OPS_CHECK(getSizeOfDimension(blockSizeShape, 0) == 2);

564

565

// paddings need to be provided as a 2-D int32 tensor.

566

NN_OPS_CHECK(paddingsShape.type == OperandType::TENSOR_INT32);

567

NN_OPS_CHECK(getNumberOfDimensions(paddingsShape) == 2);

568

NN_OPS_CHECK(getSizeOfDimension(paddingsShape, 0) == 2);

569

NN_OPS_CHECK(getSizeOfDimension(paddingsShape, 1) == 2);

570

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

571

uint32_t batches = getSizeOfDimension(input, 0);

572

uint32_t height = getSizeOfDimension(input, 1);

573

uint32_t width = getSizeOfDimension(input, 2);

Miao Wang

2018-01-21 02:39:41 -0800

[diff] [blame]

574

uint32_t channels = getSizeOfDimension(input, 3);

575

576

uint32_t paddedHeight = paddingsData[0] + height + paddingsData[1];

577

uint32_t paddedWidth = paddingsData[2] + width + paddingsData[3];

578

579

NN_OPS_CHECK(paddedHeight % blockSizeData[0] == 0);

Miao Wang

5fbe3e1

2018-02-20 14:34:00 -0800

[diff] [blame]

580

NN_OPS_CHECK(paddedWidth % blockSizeData[1] == 0);

Miao Wang

2018-01-21 02:39:41 -0800

[diff] [blame]

581

582

output->type = input.type;

583

output->dimensions = {batches * (blockSizeData[0] * blockSizeData[1]),

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

584

paddedHeight / blockSizeData[0], paddedWidth / blockSizeData[1],

Miao Wang

2018-01-21 02:39:41 -0800

[diff] [blame]

585

channels};

586

output->offset = input.offset;

587

output->scale = input.scale;

return true;

}

Michael Butler

2019-07-22 18:59:46 -0700

[diff] [blame]

592

bool meanPrepare(const Shape& input, const int32_t* axisData, const Shape& axisShape, bool keepDims,

Miao Wang

2018-01-21 02:39:41 -0800

[diff] [blame]

593

Shape* output) {

Miao Wang

2018-01-21 02:39:41 -0800

[diff] [blame]

594

// perm need to be provided as a 1-D int32 tensor.

595

NN_OPS_CHECK(axisShape.type == OperandType::TENSOR_INT32);

596

NN_OPS_CHECK(getNumberOfDimensions(axisShape) == 1);

597

598

int32_t numInputDims = static_cast<int32_t>(getNumberOfDimensions(input));

599

int32_t axisSize = static_cast<int32_t>(getSizeOfDimension(axisShape, 0));

600

601

// Determines size of output tensor.

602

if (keepDims) {

603

std::vector<uint32_t> outDims(numInputDims);

604

for (int32_t idx = 0; idx < numInputDims; ++idx) {

605

bool isAxis = false;

606

for (int32_t axisIdx = 0; axisIdx < axisSize; ++axisIdx) {

607

if (axisData[axisIdx] == idx || axisData[axisIdx] + numInputDims == idx) {

isAxis = true;

break;

}

}

if (isAxis) {

outDims[idx] = 1;

} else {

outDims[idx] = getSizeOfDimension(input, idx);

616

}

617

}

618

output->dimensions = outDims;

619

} else {

620

// Calculates size of reducing axis.

621

int32_t numReduceAxis = axisSize;

622

for (int32_t i = 0; i < axisSize; ++i) {

623

int32_t current = axisData[i];

624

if (current < 0) {

625

current += numInputDims;

626

}

627

NN_OPS_CHECK(current >= 0 && current < numInputDims);

628

for (int32_t j = 0; j < i; ++j) {

629

int32_t previous = axisData[j];

630

if (previous < 0) {

631

previous += numInputDims;

632

}

633

if (current == previous) {

--numReduceAxis;

break;

}

}

}

// Determines output dimensions.

640

std::vector<uint32_t> outDims(numInputDims - numReduceAxis);

641

int32_t numSkipAxis = 0;

642

for (int32_t idx = 0; idx < numInputDims; ++idx) {

643

bool isAxis = false;

644

for (int32_t axisIdx = 0; axisIdx < axisSize; ++axisIdx) {

645

if (axisData[axisIdx] == idx || axisData[axisIdx] + numInputDims == idx) {

++numSkipAxis;

isAxis = true;

break;

}

}

if (!isAxis) {

outDims[idx - numSkipAxis] = getSizeOfDimension(input, idx);

653

}

654

}

Lev Proleev

7391083

2020-05-05 17:26:26 +0100

[diff] [blame]

655

// Handle the case when all dimensions are removed

656

if (outDims.empty()) {

657

outDims.push_back(1);

658

}

Miao Wang

2018-01-21 02:39:41 -0800

[diff] [blame]

659

output->dimensions = outDims;

660

}

661

662

output->type = input.type;

663

output->offset = input.offset;

664

output->scale = input.scale;

return true;

}

Slava Shklyaev

2018-09-17 11:58:40 +0100

[diff] [blame]

669

bool argMinMaxPrepare(const Shape& input, int32_t axis, Shape* output) {

Slava Shklyaev

2018-10-22 12:04:16 +0100

[diff] [blame]

670

NN_CHECK(handleNegativeAxis(input, &axis));

Slava Shklyaev

2018-09-17 11:58:40 +0100

[diff] [blame]

671

672

output->type = OperandType::TENSOR_INT32;

673

674

// Copy the input dimensions, omitting the axis dimension.

675

output->dimensions.clear();

Lev Proleev

7391083

2020-05-05 17:26:26 +0100

[diff] [blame]

676

if (getNumberOfDimensions(input) > 1) {

677

output->dimensions.reserve(getNumberOfDimensions(input) - 1);

678

output->dimensions.insert(output->dimensions.end(), input.dimensions.begin(),

679

input.dimensions.begin() + axis);

680

output->dimensions.insert(output->dimensions.end(), input.dimensions.begin() + axis + 1,

681

input.dimensions.end());

682

} else {

683

output->dimensions.push_back(1);

684

}

Slava Shklyaev

2018-09-17 11:58:40 +0100

[diff] [blame]

685

686

return true;

687

}

Lev Proleev

dfc2f41

2018-09-13 16:17:58 +0100

[diff] [blame]

688

689

bool splitPrepare(const Shape& input, int32_t axis, int32_t numOutputs,

690

std::vector<Shape>* output) {

Slava Shklyaev

2018-10-22 12:04:16 +0100

[diff] [blame]

691

NN_CHECK(handleNegativeAxis(input, &axis));

Lev Proleev

dfc2f41

2018-09-13 16:17:58 +0100

[diff] [blame]

692

693

const int32_t sizeOfAxisToSplit = input.dimensions[axis];

694

NN_OPS_CHECK(sizeOfAxisToSplit % numOutputs == 0);

695

const int32_t sliceSize = sizeOfAxisToSplit / numOutputs;

696

697

for (int i = 0; i < numOutputs; ++i) {

698

output->at(i).type = input.type;

699

output->at(i).dimensions = input.dimensions;

700

output->at(i).dimensions[axis] = sliceSize;

701

output->at(i).offset = input.offset;

702

output->at(i).scale = input.scale;

}

return true;

}

Xusong Wang

2018-08-17 15:38:32 -0700

[diff] [blame]

707

bool groupedConvPrepare(const Shape& input, const Shape& filter, const Shape& bias,

708

int32_t padding_left, int32_t padding_right, int32_t padding_top,

709

int32_t padding_bottom, int32_t stride_width, int32_t stride_height,

710

int32_t numGroups, Shape* output) {

Przemyslaw Szczepaniak

a4e6a65

2018-12-28 11:52:32 +0000

[diff] [blame]

711

if (filter.type == OperandType::TENSOR_QUANT8_SYMM_PER_CHANNEL) {

Lev Proleev

5976d73

2019-12-18 14:50:37 +0000

[diff] [blame]

712

NN_OPS_CHECK(input.type == OperandType::TENSOR_QUANT8_ASYMM ||

713

input.type == OperandType::TENSOR_QUANT8_ASYMM_SIGNED);

Przemyslaw Szczepaniak

a4e6a65

2018-12-28 11:52:32 +0000

[diff] [blame]

714

} else {

715

NN_OPS_CHECK(input.type == filter.type);

716

}

Lev Proleev

5976d73

2019-12-18 14:50:37 +0000

[diff] [blame]

717

if (input.type == OperandType::TENSOR_QUANT8_ASYMM ||

718

input.type == OperandType::TENSOR_QUANT8_ASYMM_SIGNED) {

Xusong Wang

5339dc3

2018-08-17 15:38:32 -0700

[diff] [blame]

719

NN_OPS_CHECK(bias.type == OperandType::TENSOR_INT32);

720

} else {

721

NN_OPS_CHECK(input.type == bias.type);

722

}

723

NN_OPS_CHECK(getNumberOfDimensions(input) == 4);

724

NN_OPS_CHECK(getNumberOfDimensions(filter) == 4);

725

NN_OPS_CHECK(getNumberOfDimensions(bias) == 1);

726

727

NN_OPS_CHECK(getSizeOfDimension(filter, 0) == getSizeOfDimension(bias, 0));

728

729

NN_OPS_CHECK(getSizeOfDimension(filter, 3) * numGroups == getSizeOfDimension(input, 3));

730

NN_OPS_CHECK(getSizeOfDimension(filter, 0) % numGroups == 0);

731

732

uint32_t channels_out = getSizeOfDimension(filter, 0);

733

uint32_t width = getSizeOfDimension(input, 2);

734

uint32_t height = getSizeOfDimension(input, 1);

735

uint32_t filterWidth = getSizeOfDimension(filter, 2);

736

uint32_t filterHeight = getSizeOfDimension(filter, 1);

737

uint32_t batches = getSizeOfDimension(input, 0);

738

Xusong Wang

d0cc11f

2019-04-12 13:38:49 -0700

[diff] [blame]

739

NN_RET_CHECK_GT(static_cast<int32_t>(filterWidth), padding_left);

740

NN_RET_CHECK_GT(static_cast<int32_t>(filterWidth), padding_right);

741

NN_RET_CHECK_GT(static_cast<int32_t>(filterHeight), padding_top);

742

NN_RET_CHECK_GT(static_cast<int32_t>(filterHeight), padding_bottom);

Xusong Wang

fa3b942

2019-02-27 14:44:14 -0800

[diff] [blame]

743

Xusong Wang

5339dc3

2018-08-17 15:38:32 -0700

[diff] [blame]

744

uint32_t outWidth =

745

computeOutSize(width, filterWidth, stride_width, padding_left, padding_right);

746

uint32_t outHeight =

747

computeOutSize(height, filterHeight, stride_height, padding_top, padding_bottom);

748

749

output->type = input.type;

750

output->dimensions = {batches, outHeight, outWidth, channels_out};

751

return true;

752

}

Xusong Wang

4588d3c

2018-08-20 14:18:15 -0700

[diff] [blame]

753

Michael Butler