drivers/gpu/arm/midgard/backend/gpu/mali_kbase_pm_driver.c - linux-mtk - Git at Google

 /*
  *
  * (C) COPYRIGHT 2010-2019 ARM Limited. All rights reserved.
  *
  * This program is free software and is provided to you under the terms of the
  * GNU General Public License version 2 as published by the Free Software
  * Foundation, and any use by you of this program is subject to the terms
  * of such GNU licence.
  *
  * This program is distributed in the hope that it will be useful,
  * but WITHOUT ANY WARRANTY; without even the implied warranty of
  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
  * GNU General Public License for more details.
  *
  * You should have received a copy of the GNU General Public License
  * along with this program; if not, you can access it online at
  * http://www.gnu.org/licenses/gpl-2.0.html.
  *
  * SPDX-License-Identifier: GPL-2.0
  *
  */


 /*
  * Base kernel Power Management hardware control
  */

 #include <mali_kbase.h>
 #include <mali_kbase_config_defaults.h>
 #include <mali_midg_regmap.h>
 #include <mali_kbase_tracepoints.h>
 #include <mali_kbase_pm.h>
 #include <mali_kbase_config_defaults.h>
 #include <mali_kbase_smc.h>
 #include <mali_kbase_hwaccess_jm.h>
 #include <mali_kbase_reset_gpu.h>
 #include <mali_kbase_ctx_sched.h>
 #include <mali_kbase_hwcnt_context.h>
 #include <backend/gpu/mali_kbase_cache_policy_backend.h>
 #include <backend/gpu/mali_kbase_device_internal.h>
 #include <backend/gpu/mali_kbase_irq_internal.h>
 #include <backend/gpu/mali_kbase_pm_internal.h>
 #include <backend/gpu/mali_kbase_l2_mmu_config.h>

 #include <linux/of.h>

 #ifdef CONFIG_MALI_CORESTACK
 bool corestack_driver_control = true;
 #else
 bool corestack_driver_control; /* Default value of 0/false */
 #endif
 module_param(corestack_driver_control, bool, 0444);
 MODULE_PARM_DESC(corestack_driver_control,
 		"Let the driver power on/off the GPU core stack independently "
 		"without involving the Power Domain Controller. This should "
 		"only be enabled on platforms for which integration of the PDC "
 		"to the Mali GPU is known to be problematic.");
 KBASE_EXPORT_TEST_API(corestack_driver_control);

 #ifdef CONFIG_MALI_PLATFORM_POWER_DOWN_ONLY
 bool platform_power_down_only = true;
 #else
 bool platform_power_down_only; /* Default value of 0/false */
 #endif
 module_param(platform_power_down_only, bool, 0444);
 MODULE_PARM_DESC(platform_power_down_only,
 		"Disable power down of individual cores.");

 /**
  * enum kbasep_pm_action - Actions that can be performed on a core.
  *
  * This enumeration is private to the file. Its values are set to allow
  * core_type_to_reg() function, which decodes this enumeration, to be simpler
  * and more efficient.
  *
  * @ACTION_PRESENT: The cores that are present
  * @ACTION_READY: The cores that are ready
  * @ACTION_PWRON: Power on the cores specified
  * @ACTION_PWROFF: Power off the cores specified
  * @ACTION_PWRTRANS: The cores that are transitioning
  * @ACTION_PWRACTIVE: The cores that are active
  */
 enum kbasep_pm_action {
 	ACTION_PRESENT = 0,
 	ACTION_READY = (SHADER_READY_LO - SHADER_PRESENT_LO),
 	ACTION_PWRON = (SHADER_PWRON_LO - SHADER_PRESENT_LO),
 	ACTION_PWROFF = (SHADER_PWROFF_LO - SHADER_PRESENT_LO),
 	ACTION_PWRTRANS = (SHADER_PWRTRANS_LO - SHADER_PRESENT_LO),
 	ACTION_PWRACTIVE = (SHADER_PWRACTIVE_LO - SHADER_PRESENT_LO)
 };

 static u64 kbase_pm_get_state(
 		struct kbase_device *kbdev,
 		enum kbase_pm_core_type core_type,
 		enum kbasep_pm_action action);

 static bool kbase_pm_is_l2_desired(struct kbase_device *kbdev)
 {
 	if (kbdev->pm.backend.protected_entry_transition_override)
 		return false;

 	if (kbdev->pm.backend.protected_transition_override &&
 			kbdev->pm.backend.protected_l2_override)
 		return true;

 	if (kbdev->pm.backend.protected_transition_override &&
 			!kbdev->pm.backend.shaders_desired)
 		return false;

 	return kbdev->pm.backend.l2_desired;
 }

 void kbase_pm_protected_override_enable(struct kbase_device *kbdev)
 {
 	lockdep_assert_held(&kbdev->hwaccess_lock);

 	kbdev->pm.backend.protected_transition_override = true;
 }
 void kbase_pm_protected_override_disable(struct kbase_device *kbdev)
 {
 	lockdep_assert_held(&kbdev->hwaccess_lock);

 	kbdev->pm.backend.protected_transition_override = false;
 }

 int kbase_pm_protected_entry_override_enable(struct kbase_device *kbdev)
 {
 	lockdep_assert_held(&kbdev->hwaccess_lock);

 	WARN_ON(!kbdev->protected_mode_transition);

 	if (kbdev->pm.backend.l2_always_on &&
 	    (kbdev->system_coherency == COHERENCY_ACE)) {
 		WARN_ON(kbdev->pm.backend.protected_entry_transition_override);

 		/*
 		 * If there is already a GPU reset pending then wait for it to
 		 * complete before initiating a special reset for protected
 		 * mode entry.
 		 */
 		if (kbase_reset_gpu_silent(kbdev))
 			return -EAGAIN;

 		kbdev->pm.backend.protected_entry_transition_override = true;
 	}

 	return 0;
 }

 void kbase_pm_protected_entry_override_disable(struct kbase_device *kbdev)
 {
 	lockdep_assert_held(&kbdev->hwaccess_lock);

 	WARN_ON(!kbdev->protected_mode_transition);

 	if (kbdev->pm.backend.l2_always_on &&
 	    (kbdev->system_coherency == COHERENCY_ACE)) {
 		WARN_ON(!kbdev->pm.backend.protected_entry_transition_override);

 		kbdev->pm.backend.protected_entry_transition_override = false;
 	}
 }

 void kbase_pm_protected_l2_override(struct kbase_device *kbdev, bool override)
 {
 	lockdep_assert_held(&kbdev->hwaccess_lock);

 	if (override) {
 		kbdev->pm.backend.protected_l2_override++;
 		WARN_ON(kbdev->pm.backend.protected_l2_override <= 0);
 	} else {
 		kbdev->pm.backend.protected_l2_override--;
 		WARN_ON(kbdev->pm.backend.protected_l2_override < 0);
 	}

 	kbase_pm_update_state(kbdev);
 }

 /**
  * core_type_to_reg - Decode a core type and action to a register.
  *
  * Given a core type (defined by kbase_pm_core_type) and an action (defined
  * by kbasep_pm_action) this function will return the register offset that
  * will perform the action on the core type. The register returned is the _LO
  * register and an offset must be applied to use the _HI register.
  *
  * @core_type: The type of core
  * @action:    The type of action
  *
  * Return: The register offset of the _LO register that performs an action of
  * type @action on a core of type @core_type.
  */
 static u32 core_type_to_reg(enum kbase_pm_core_type core_type,
 						enum kbasep_pm_action action)
 {
 	if (corestack_driver_control) {
 		if (core_type == KBASE_PM_CORE_STACK) {
 			switch (action) {
 			case ACTION_PRESENT:
 				return STACK_PRESENT_LO;
 			case ACTION_READY:
 				return STACK_READY_LO;
 			case ACTION_PWRON:
 				return STACK_PWRON_LO;
 			case ACTION_PWROFF:
 				return STACK_PWROFF_LO;
 			case ACTION_PWRTRANS:
 				return STACK_PWRTRANS_LO;
 			default:
 				WARN(1, "Invalid action for core type\n");
 			}
 		}
 	}

 	return (u32)core_type + (u32)action;
 }

 #ifdef CONFIG_ARM64
 static void mali_cci_flush_l2(struct kbase_device *kbdev)
 {
 	const u32 mask = CLEAN_CACHES_COMPLETED | RESET_COMPLETED;
 	u32 loops = KBASE_CLEAN_CACHE_MAX_LOOPS;
 	u32 raw;

 	/*
 	 * Note that we don't take the cache flush mutex here since
 	 * we expect to be the last user of the L2, all other L2 users
 	 * would have dropped their references, to initiate L2 power
 	 * down, L2 power down being the only valid place for this
 	 * to be called from.
 	 */

 	kbase_reg_write(kbdev,
 			GPU_CONTROL_REG(GPU_COMMAND),
 			GPU_COMMAND_CLEAN_INV_CACHES);

 	raw = kbase_reg_read(kbdev,
 		GPU_CONTROL_REG(GPU_IRQ_RAWSTAT));

 	/* Wait for cache flush to complete before continuing, exit on
 	 * gpu resets or loop expiry. */
 	while (((raw & mask) == 0) && --loops) {
 		raw = kbase_reg_read(kbdev,
 					GPU_CONTROL_REG(GPU_IRQ_RAWSTAT));
 	}
 }
 #endif

 /**
  * kbase_pm_invoke - Invokes an action on a core set
  *
  * This function performs the action given by @action on a set of cores of a
  * type given by @core_type. It is a static function used by
  * kbase_pm_transition_core_type()
  *
  * @kbdev:     The kbase device structure of the device
  * @core_type: The type of core that the action should be performed on
  * @cores:     A bit mask of cores to perform the action on (low 32 bits)
  * @action:    The action to perform on the cores
  */
 static void kbase_pm_invoke(struct kbase_device *kbdev,
 					enum kbase_pm_core_type core_type,
 					u64 cores,
 					enum kbasep_pm_action action)
 {
 	u32 reg;
 	u32 lo = cores & 0xFFFFFFFF;
 	u32 hi = (cores >> 32) & 0xFFFFFFFF;

 	/* When 'platform_power_down_only' is enabled, no core type should be
 	 * turned off individually.
 	 */
 	KBASE_DEBUG_ASSERT(!(action == ACTION_PWROFF &&
 			platform_power_down_only));

 	lockdep_assert_held(&kbdev->hwaccess_lock);

 	reg = core_type_to_reg(core_type, action);

 	KBASE_DEBUG_ASSERT(reg);

 	if (cores) {
 		u64 state = kbase_pm_get_state(kbdev, core_type, ACTION_READY);

 		if (action == ACTION_PWRON)
 			state |= cores;
 		else if (action == ACTION_PWROFF)
 			state &= ~cores;
 		KBASE_TLSTREAM_AUX_PM_STATE(kbdev, core_type, state);
 	}

 	/* Tracing */
 	if (cores) {
 		if (action == ACTION_PWRON)
 			switch (core_type) {
 			case KBASE_PM_CORE_SHADER:
 				KBASE_TRACE_ADD(kbdev, PM_PWRON, NULL, NULL, 0u,
 									lo);
 				break;
 			case KBASE_PM_CORE_TILER:
 				KBASE_TRACE_ADD(kbdev, PM_PWRON_TILER, NULL,
 								NULL, 0u, lo);
 				break;
 			case KBASE_PM_CORE_L2:
 				KBASE_TRACE_ADD(kbdev, PM_PWRON_L2, NULL, NULL,
 									0u, lo);
 				break;
 			default:
 				break;
 			}
 		else if (action == ACTION_PWROFF)
 			switch (core_type) {
 			case KBASE_PM_CORE_SHADER:
 				KBASE_TRACE_ADD(kbdev, PM_PWROFF, NULL, NULL,
 									0u, lo);
 				break;
 			case KBASE_PM_CORE_TILER:
 				KBASE_TRACE_ADD(kbdev, PM_PWROFF_TILER, NULL,
 								NULL, 0u, lo);
 				break;
 			case KBASE_PM_CORE_L2:
 				KBASE_TRACE_ADD(kbdev, PM_PWROFF_L2, NULL, NULL,
 									0u, lo);
 				/* disable snoops before L2 is turned off */
 				kbase_pm_cache_snoop_disable(kbdev);
 				break;
 			default:
 				break;
 			}
 	}

 	if (lo != 0)
 		kbase_reg_write(kbdev, GPU_CONTROL_REG(reg), lo);

 	if (hi != 0)
 		kbase_reg_write(kbdev, GPU_CONTROL_REG(reg + 4), hi);
 }

 /**
  * kbase_pm_get_state - Get information about a core set
  *
  * This function gets information (chosen by @action) about a set of cores of
  * a type given by @core_type. It is a static function used by
  * kbase_pm_get_active_cores(), kbase_pm_get_trans_cores() and
  * kbase_pm_get_ready_cores().
  *
  * @kbdev:     The kbase device structure of the device
  * @core_type: The type of core that the should be queried
  * @action:    The property of the cores to query
  *
  * Return: A bit mask specifying the state of the cores
  */
 static u64 kbase_pm_get_state(struct kbase_device *kbdev,
 					enum kbase_pm_core_type core_type,
 					enum kbasep_pm_action action)
 {
 	u32 reg;
 	u32 lo, hi;

 	reg = core_type_to_reg(core_type, action);

 	KBASE_DEBUG_ASSERT(reg);

 	lo = kbase_reg_read(kbdev, GPU_CONTROL_REG(reg));
 	hi = kbase_reg_read(kbdev, GPU_CONTROL_REG(reg + 4));

 	return (((u64) hi) << 32) | ((u64) lo);
 }

 /**
  * kbase_pm_get_present_cores - Get the cores that are present
  *
  * @kbdev: Kbase device
  * @type: The type of cores to query
  *
  * Return: Bitmask of the cores that are present
  */
 u64 kbase_pm_get_present_cores(struct kbase_device *kbdev,
 						enum kbase_pm_core_type type)
 {
 	KBASE_DEBUG_ASSERT(kbdev != NULL);

 	switch (type) {
 	case KBASE_PM_CORE_L2:
 		return kbdev->gpu_props.props.raw_props.l2_present;
 	case KBASE_PM_CORE_SHADER:
 		return kbdev->gpu_props.props.raw_props.shader_present;
 	case KBASE_PM_CORE_TILER:
 		return kbdev->gpu_props.props.raw_props.tiler_present;
 	case KBASE_PM_CORE_STACK:
 		return kbdev->gpu_props.props.raw_props.stack_present;
 	default:
 		break;
 	}
 	KBASE_DEBUG_ASSERT(0);

 	return 0;
 }

 KBASE_EXPORT_TEST_API(kbase_pm_get_present_cores);

 /**
  * kbase_pm_get_active_cores - Get the cores that are "active"
  *                             (busy processing work)
  *
  * @kbdev: Kbase device
  * @type: The type of cores to query
  *
  * Return: Bitmask of cores that are active
  */
 u64 kbase_pm_get_active_cores(struct kbase_device *kbdev,
 						enum kbase_pm_core_type type)
 {
 	return kbase_pm_get_state(kbdev, type, ACTION_PWRACTIVE);
 }

 KBASE_EXPORT_TEST_API(kbase_pm_get_active_cores);

 /**
  * kbase_pm_get_trans_cores - Get the cores that are transitioning between
  *                            power states
  *
  * @kbdev: Kbase device
  * @type: The type of cores to query
  *
  * Return: Bitmask of cores that are transitioning
  */
 u64 kbase_pm_get_trans_cores(struct kbase_device *kbdev,
 						enum kbase_pm_core_type type)
 {
 	return kbase_pm_get_state(kbdev, type, ACTION_PWRTRANS);
 }

 KBASE_EXPORT_TEST_API(kbase_pm_get_trans_cores);

 /**
  * kbase_pm_get_ready_cores - Get the cores that are powered on
  *
  * @kbdev: Kbase device
  * @type: The type of cores to query
  *
  * Return: Bitmask of cores that are ready (powered on)
  */
 u64 kbase_pm_get_ready_cores(struct kbase_device *kbdev,
 						enum kbase_pm_core_type type)
 {
 	u64 result;

 	result = kbase_pm_get_state(kbdev, type, ACTION_READY);

 	switch (type) {
 	case KBASE_PM_CORE_SHADER:
 		KBASE_TRACE_ADD(kbdev, PM_CORES_POWERED, NULL, NULL, 0u,
 								(u32) result);
 		break;
 	case KBASE_PM_CORE_TILER:
 		KBASE_TRACE_ADD(kbdev, PM_CORES_POWERED_TILER, NULL, NULL, 0u,
 								(u32) result);
 		break;
 	case KBASE_PM_CORE_L2:
 		KBASE_TRACE_ADD(kbdev, PM_CORES_POWERED_L2, NULL, NULL, 0u,
 								(u32) result);
 		break;
 	default:
 		break;
 	}

 	return result;
 }

 KBASE_EXPORT_TEST_API(kbase_pm_get_ready_cores);

 static void kbase_pm_trigger_hwcnt_disable(struct kbase_device *kbdev)
 {
 	struct kbase_pm_backend_data *backend = &kbdev->pm.backend;

 	lockdep_assert_held(&kbdev->hwaccess_lock);

 	/* See if we can get away with disabling hwcnt
 	 * atomically, otherwise kick off a worker.
 	 */
 	if (kbase_hwcnt_context_disable_atomic(kbdev->hwcnt_gpu_ctx)) {
 		backend->hwcnt_disabled = true;
 	} else {
 #if KERNEL_VERSION(3, 16, 0) > LINUX_VERSION_CODE
 		queue_work(system_wq,
 			&backend->hwcnt_disable_work);
 #else
 		queue_work(system_highpri_wq,
 			&backend->hwcnt_disable_work);
 #endif
 	}
 }

 static void kbase_pm_l2_config_override(struct kbase_device *kbdev)
 {
 	u32 val;

 	/*
 	 * Skip if it is not supported
 	 */
 	if (!kbase_hw_has_feature(kbdev, BASE_HW_FEATURE_L2_CONFIG))
 		return;

 	/*
 	 * Skip if size and hash are not given explicitly,
 	 * which means default values are used.
 	 */
 	if ((kbdev->l2_size_override == 0) && (kbdev->l2_hash_override == 0))
 		return;

 	val = kbase_reg_read(kbdev, GPU_CONTROL_REG(L2_CONFIG));

 	if (kbdev->l2_size_override) {
 		val &= ~L2_CONFIG_SIZE_MASK;
 		val |= (kbdev->l2_size_override << L2_CONFIG_SIZE_SHIFT);
 	}

 	if (kbdev->l2_hash_override) {
 		val &= ~L2_CONFIG_HASH_MASK;
 		val |= (kbdev->l2_hash_override << L2_CONFIG_HASH_SHIFT);
 	}

 	dev_dbg(kbdev->dev, "Program 0x%x to L2_CONFIG\n", val);

 	/* Write L2_CONFIG to override */
 	kbase_reg_write(kbdev, GPU_CONTROL_REG(L2_CONFIG), val);
 }

 static void kbase_pm_control_gpu_clock(struct kbase_device *kbdev)
 {
 	struct kbase_pm_backend_data *const backend = &kbdev->pm.backend;

 	lockdep_assert_held(&kbdev->hwaccess_lock);

 	queue_work(system_wq, &backend->gpu_clock_control_work);
 }

 static const char *kbase_l2_core_state_to_string(enum kbase_l2_core_state state)
 {
 	const char *const strings[] = {
 #define KBASEP_L2_STATE(n) #n,
 #include "mali_kbase_pm_l2_states.h"
 #undef KBASEP_L2_STATE
 	};
 	if (WARN_ON((size_t)state >= ARRAY_SIZE(strings)))
 		return "Bad level 2 cache state";
 	else
 		return strings[state];
 }

 static u64 kbase_pm_l2_update_state(struct kbase_device *kbdev)
 {
 	struct kbase_pm_backend_data *backend = &kbdev->pm.backend;
 	u64 l2_present = kbdev->gpu_props.props.raw_props.l2_present;
 	u64 tiler_present = kbdev->gpu_props.props.raw_props.tiler_present;
 	enum kbase_l2_core_state prev_state;

 	lockdep_assert_held(&kbdev->hwaccess_lock);

 	do {
 		/* Get current state */
 		u64 l2_trans = kbase_pm_get_trans_cores(kbdev,
 				KBASE_PM_CORE_L2);
 		u64 l2_ready = kbase_pm_get_ready_cores(kbdev,
 				KBASE_PM_CORE_L2);
 		u64 tiler_trans = kbase_pm_get_trans_cores(kbdev,
 				KBASE_PM_CORE_TILER);
 		u64 tiler_ready = kbase_pm_get_ready_cores(kbdev,
 				KBASE_PM_CORE_TILER);

 		/* mask off ready from trans in case transitions finished
 		 * between the register reads
 		 */
 		l2_trans &= ~l2_ready;
 		tiler_trans &= ~tiler_ready;

 		prev_state = backend->l2_state;

 		switch (backend->l2_state) {
 		case KBASE_L2_OFF:
 			if (kbase_pm_is_l2_desired(kbdev)) {
 				/*
 				 * Set the desired config for L2 before powering
 				 * it on
 				 */
 				kbase_pm_l2_config_override(kbdev);

 				/* L2 is required, power on.  Powering on the
 				 * tiler will also power the first L2 cache.
 				 */
 				kbase_pm_invoke(kbdev, KBASE_PM_CORE_TILER,
 						tiler_present, ACTION_PWRON);

 				/* If we have more than one L2 cache then we
 				 * must power them on explicitly.
 				 */
 				if (l2_present != 1)
 					kbase_pm_invoke(kbdev, KBASE_PM_CORE_L2,
 							l2_present & ~1,
 							ACTION_PWRON);
 				backend->l2_state = KBASE_L2_PEND_ON;
 			}
 			break;

 		case KBASE_L2_PEND_ON:
 			if (!l2_trans && l2_ready == l2_present && !tiler_trans
 					&& tiler_ready == tiler_present) {
 				KBASE_TRACE_ADD(kbdev,
 						PM_CORES_CHANGE_AVAILABLE_TILER,
 						NULL, NULL, 0u,
 						(u32)tiler_ready);
 				/*
 				 * Ensure snoops are enabled after L2 is powered
 				 * up. Note that kbase keeps track of the snoop
 				 * state, so safe to repeatedly call.
 				 */
 				kbase_pm_cache_snoop_enable(kbdev);

 				/* With the L2 enabled, we can now enable
 				 * hardware counters.
 				 */
 				if (kbdev->pm.backend.gpu_clock_slow_down_wa)
 					backend->l2_state =
 						KBASE_L2_RESTORE_CLOCKS;
 				else
 					backend->l2_state =
 						KBASE_L2_ON_HWCNT_ENABLE;

 				/* Now that the L2 is on, the shaders can start
 				 * powering on if they're required. The obvious
 				 * way to do this would be to call
 				 * kbase_pm_shaders_update_state() here.
 				 * However, that would make the two state
 				 * machines mutually recursive, as the opposite
 				 * would be needed for powering down. Instead,
 				 * callers of this function should use the
 				 * kbase_pm_update_state() wrapper, which will
 				 * call the shader state machine immediately
 				 * after the L2 (for power up), or
 				 * automatically re-invoke the L2 state machine
 				 * when the shaders power down.
 				 */
 			}
 			break;

 		case KBASE_L2_RESTORE_CLOCKS:
 			/* We always assume only GPUs being affected by
 			 * BASE_HW_ISSUE_GPU2017_1336 fall into this state
 			 */
 			WARN_ON_ONCE(!kbdev->pm.backend.gpu_clock_slow_down_wa);

 			/* If L2 not needed, we need to make sure cancellation
 			 * of any previously issued work to restore GPU clock.
 			 * For it, move to KBASE_L2_SLOW_DOWN_CLOCKS state.
 			 */
 			if (!kbase_pm_is_l2_desired(kbdev)) {
 				backend->l2_state = KBASE_L2_SLOW_DOWN_CLOCKS;
 				break;
 			}

 			backend->gpu_clock_slow_down_desired = false;
 			if (backend->gpu_clock_slowed_down)
 				kbase_pm_control_gpu_clock(kbdev);
 			else
 				backend->l2_state = KBASE_L2_ON_HWCNT_ENABLE;
 			break;

 		case KBASE_L2_ON_HWCNT_ENABLE:
 			backend->hwcnt_desired = true;
 			if (backend->hwcnt_disabled) {
 				kbase_hwcnt_context_enable(
 					kbdev->hwcnt_gpu_ctx);
 				backend->hwcnt_disabled = false;
 			}
 			backend->l2_state = KBASE_L2_ON;
 			break;

 		case KBASE_L2_ON:
 			if (!kbase_pm_is_l2_desired(kbdev)) {
 				/* Do not power off L2 until the shaders and
 				 * core stacks are off.
 				 */
 				if (backend->shaders_state != KBASE_SHADERS_OFF_CORESTACK_OFF)
 					break;

 				/* We need to make sure hardware counters are
 				 * disabled before powering down the L2, to
 				 * prevent loss of data.
 				 *
 				 * We waited until after the cores were powered
 				 * down to prevent ping-ponging between hwcnt
 				 * enabled and disabled, which would have
 				 * happened if userspace submitted more work
 				 * while we were trying to power down.
 				 */
 				backend->l2_state = KBASE_L2_ON_HWCNT_DISABLE;
 			}
 			break;

 		case KBASE_L2_ON_HWCNT_DISABLE:
 			/* If the L2 became desired while we were waiting on the
 			 * worker to do the actual hwcnt disable (which might
 			 * happen if some work was submitted immediately after
 			 * the shaders powered off), then we need to early-out
 			 * of this state and re-enable hwcnt.
 			 *
 			 * If we get lucky, the hwcnt disable might not have
 			 * actually started yet, and the logic in the hwcnt
 			 * enable state will prevent the worker from
 			 * performing the disable entirely, preventing loss of
 			 * any hardware counter data.
 			 *
 			 * If the hwcnt disable has started, then we'll lose
 			 * a tiny amount of hardware counter data between the
 			 * disable and the re-enable occurring.
 			 *
 			 * This loss of data is preferable to the alternative,
 			 * which is to block the shader cores from doing any
 			 * work until we're sure hwcnt has been re-enabled.
 			 */
 			if (kbase_pm_is_l2_desired(kbdev)) {
 				backend->l2_state = KBASE_L2_ON_HWCNT_ENABLE;
 				break;
 			}

 			backend->hwcnt_desired = false;
 			if (!backend->hwcnt_disabled) {
 				kbase_pm_trigger_hwcnt_disable(kbdev);
 			}

 			if (backend->hwcnt_disabled) {
 				if (kbdev->pm.backend.gpu_clock_slow_down_wa)
 					backend->l2_state =
 						KBASE_L2_SLOW_DOWN_CLOCKS;
 				else
 					backend->l2_state = KBASE_L2_POWER_DOWN;
 			}
 			break;

 		case KBASE_L2_SLOW_DOWN_CLOCKS:
 			/* We always assume only GPUs being affected by
 			 * BASE_HW_ISSUE_GPU2017_1336 fall into this state
 			 */
 			WARN_ON_ONCE(!kbdev->pm.backend.gpu_clock_slow_down_wa);

 			/* L2 needs to be powered up. And we need to make sure
 			 * cancellation of any previously issued work to slow
 			 * down GPU clock. For it, we move to the state,
 			 * KBASE_L2_RESTORE_CLOCKS.
 			 */
 			if (kbase_pm_is_l2_desired(kbdev)) {
 				backend->l2_state = KBASE_L2_RESTORE_CLOCKS;
 				break;
 			}

 			backend->gpu_clock_slow_down_desired = true;
 			if (!backend->gpu_clock_slowed_down)
 				kbase_pm_control_gpu_clock(kbdev);
 			else
 				backend->l2_state = KBASE_L2_POWER_DOWN;

 			break;

 		case KBASE_L2_POWER_DOWN:
 			if (!platform_power_down_only && !backend->l2_always_on)
 				/* Powering off the L2 will also power off the
 				 * tiler.
 				 */
 				kbase_pm_invoke(kbdev, KBASE_PM_CORE_L2,
 						l2_present,
 						ACTION_PWROFF);
 			else
 				/* If L2 cache is powered then we must flush it
 				 * before we power off the GPU. Normally this
 				 * would have been handled when the L2 was
 				 * powered off.
 				 */
 				kbase_gpu_start_cache_clean_nolock(
 						kbdev);

 			KBASE_TRACE_ADD(kbdev, PM_CORES_CHANGE_AVAILABLE_TILER,
 					NULL, NULL, 0u, 0u);

 			backend->l2_state = KBASE_L2_PEND_OFF;
 			break;

 		case KBASE_L2_PEND_OFF:
 			if (!platform_power_down_only && !backend->l2_always_on) {
 				/* We only need to check the L2 here - if the L2
 				 * is off then the tiler is definitely also off.
 				 */
 				if (!l2_trans && !l2_ready)
 					/* L2 is now powered off */
 					backend->l2_state = KBASE_L2_OFF;
 			} else {
 				if (!kbdev->cache_clean_in_progress)
 					backend->l2_state = KBASE_L2_OFF;
 			}
 			break;

 		case KBASE_L2_RESET_WAIT:
 			/* Reset complete  */
 			if (!backend->in_reset)
 				backend->l2_state = KBASE_L2_OFF;
 			break;

 		default:
 			WARN(1, "Invalid state in l2_state: %d",
 					backend->l2_state);
 		}

 		if (backend->l2_state != prev_state)
 			dev_dbg(kbdev->dev, "L2 state transition: %s to %s\n",
 				kbase_l2_core_state_to_string(prev_state),
 				kbase_l2_core_state_to_string(
 					backend->l2_state));

 	} while (backend->l2_state != prev_state);

 	if (kbdev->pm.backend.invoke_poweroff_wait_wq_when_l2_off &&
 			backend->l2_state == KBASE_L2_OFF) {
 		kbdev->pm.backend.invoke_poweroff_wait_wq_when_l2_off = false;
 		queue_work(kbdev->pm.backend.gpu_poweroff_wait_wq,
 				&kbdev->pm.backend.gpu_poweroff_wait_work);
 	}

 	if (backend->l2_state == KBASE_L2_ON)
 		return l2_present;
 	return 0;
 }

 static void shader_poweroff_timer_stop_callback(struct work_struct *data)
 {
 	unsigned long flags;
 	struct kbasep_pm_tick_timer_state *stt = container_of(data,
 			struct kbasep_pm_tick_timer_state, work);
 	struct kbase_device *kbdev = container_of(stt, struct kbase_device,
 			pm.backend.shader_tick_timer);

 	hrtimer_cancel(&stt->timer);

 	spin_lock_irqsave(&kbdev->hwaccess_lock, flags);

 	stt->cancel_queued = false;
 	if (kbdev->pm.backend.gpu_powered)
 		kbase_pm_update_state(kbdev);

 	spin_unlock_irqrestore(&kbdev->hwaccess_lock, flags);
 }

 /**
  * shader_poweroff_timer_queue_cancel - cancel the shader poweroff tick timer
  * @kbdev:      pointer to kbase device
  *
  * Synchronization between the shader state machine and the timer thread is
  * difficult. This is because situations may arise where the state machine
  * wants to start the timer, but the callback is already running, and has
  * already passed the point at which it checks whether it is required, and so
  * cancels itself, even though the state machine may have just tried to call
  * hrtimer_start.
  *
  * This cannot be stopped by holding hwaccess_lock in the timer thread,
  * because there are still infinitesimally small sections at the start and end
  * of the callback where the lock is not held.
  *
  * Instead, a new state is added to the shader state machine,
  * KBASE_SHADERS_OFF_CORESTACK_OFF_TIMER_PEND_OFF. This is used to guarantee
  * that when the shaders are switched off, the timer has definitely been
  * cancelled. As a result, when KBASE_SHADERS_ON_CORESTACK_ON is left and the
  * timer is started, it is guaranteed that either the timer is already running
  * (from an availability change or cancelled timer), or hrtimer_start will
  * succeed. It is critical to avoid ending up in
  * KBASE_SHADERS_WAIT_OFF_CORESTACK_ON without the timer running, or it could
  * hang there forever.
  */
 static void shader_poweroff_timer_queue_cancel(struct kbase_device *kbdev)
 {
 	struct kbasep_pm_tick_timer_state *stt =
 			&kbdev->pm.backend.shader_tick_timer;

 	lockdep_assert_held(&kbdev->hwaccess_lock);

 	stt->needed = false;

 	if (hrtimer_active(&stt->timer) && !stt->cancel_queued) {
 		stt->cancel_queued = true;
 		queue_work(stt->wq, &stt->work);
 	}
 }

 static const char *kbase_shader_core_state_to_string(
 	enum kbase_shader_core_state state)
 {
 	const char *const strings[] = {
 #define KBASEP_SHADER_STATE(n) #n,
 #include "mali_kbase_pm_shader_states.h"
 #undef KBASEP_SHADER_STATE
 	};
 	if (WARN_ON((size_t)state >= ARRAY_SIZE(strings)))
 		return "Bad shader core state";
 	else
 		return strings[state];
 }

 static void kbase_pm_shaders_update_state(struct kbase_device *kbdev)
 {
 	struct kbase_pm_backend_data *backend = &kbdev->pm.backend;
 	struct kbasep_pm_tick_timer_state *stt =
 			&kbdev->pm.backend.shader_tick_timer;
 	enum kbase_shader_core_state prev_state;
 	u64 stacks_avail = 0;

 	lockdep_assert_held(&kbdev->hwaccess_lock);

 	if (corestack_driver_control)
 		/* Always power on all the corestacks. Disabling certain
 		 * corestacks when their respective shaders are not in the
 		 * available bitmap is not currently supported.
 		 */
 		stacks_avail = kbase_pm_get_present_cores(kbdev, KBASE_PM_CORE_STACK);

 	do {
 		u64 shaders_trans = kbase_pm_get_trans_cores(kbdev, KBASE_PM_CORE_SHADER);
 		u64 shaders_ready = kbase_pm_get_ready_cores(kbdev, KBASE_PM_CORE_SHADER);
 		u64 stacks_trans = 0;
 		u64 stacks_ready = 0;

 		if (corestack_driver_control) {
 			stacks_trans = kbase_pm_get_trans_cores(kbdev, KBASE_PM_CORE_STACK);
 			stacks_ready = kbase_pm_get_ready_cores(kbdev, KBASE_PM_CORE_STACK);
 		}

 		/* mask off ready from trans in case transitions finished
 		 * between the register reads
 		 */
 		shaders_trans &= ~shaders_ready;
 		stacks_trans &= ~stacks_ready;

 		prev_state = backend->shaders_state;

 		switch (backend->shaders_state) {
 		case KBASE_SHADERS_OFF_CORESTACK_OFF:
 			/* Ignore changes to the shader core availability
 			 * except at certain points where we can handle it,
 			 * i.e. off and SHADERS_ON_CORESTACK_ON.
 			 */
 			backend->shaders_avail = kbase_pm_ca_get_core_mask(kbdev);
 			backend->pm_shaders_core_mask = 0;

 			if (backend->shaders_desired &&
 				backend->l2_state == KBASE_L2_ON) {
 				if (backend->hwcnt_desired &&
 					!backend->hwcnt_disabled) {
 					/* Trigger a hwcounter dump */
 					backend->hwcnt_desired = false;
 					kbase_pm_trigger_hwcnt_disable(kbdev);
 				}

 				if (backend->hwcnt_disabled) {
 					if (corestack_driver_control) {
 						kbase_pm_invoke(kbdev,
 							KBASE_PM_CORE_STACK,
 							stacks_avail,
 							ACTION_PWRON);
 					}
 					backend->shaders_state =
 						KBASE_SHADERS_OFF_CORESTACK_PEND_ON;
 				}
 			}
 			break;

 		case KBASE_SHADERS_OFF_CORESTACK_PEND_ON:
 			if (!stacks_trans && stacks_ready == stacks_avail) {
 				kbase_pm_invoke(kbdev, KBASE_PM_CORE_SHADER,
 						backend->shaders_avail, ACTION_PWRON);

 				backend->shaders_state = KBASE_SHADERS_PEND_ON_CORESTACK_ON;
 			}
 			break;

 		case KBASE_SHADERS_PEND_ON_CORESTACK_ON:
 			if (!shaders_trans && shaders_ready == backend->shaders_avail) {
 				KBASE_TRACE_ADD(kbdev,
 						PM_CORES_CHANGE_AVAILABLE,
 						NULL, NULL, 0u, (u32)shaders_ready);
 				backend->pm_shaders_core_mask = shaders_ready;
 				backend->hwcnt_desired = true;
 				if (backend->hwcnt_disabled) {
 					kbase_hwcnt_context_enable(
 						kbdev->hwcnt_gpu_ctx);
 					backend->hwcnt_disabled = false;
 				}
 				backend->shaders_state = KBASE_SHADERS_ON_CORESTACK_ON;
 			}
 			break;

 		case KBASE_SHADERS_ON_CORESTACK_ON:
 			backend->shaders_avail = kbase_pm_ca_get_core_mask(kbdev);

 			/* If shaders to change state, trigger a counter dump */
 			if (!backend->shaders_desired ||
 				(backend->shaders_avail & ~shaders_ready)) {
 				backend->hwcnt_desired = false;
 				if (!backend->hwcnt_disabled)
 					kbase_pm_trigger_hwcnt_disable(kbdev);
 				backend->shaders_state =
 					KBASE_SHADERS_ON_CORESTACK_ON_RECHECK;
 			}
 			break;

 		case KBASE_SHADERS_ON_CORESTACK_ON_RECHECK:
 			backend->shaders_avail =
 				kbase_pm_ca_get_core_mask(kbdev);

 			if (!backend->hwcnt_disabled) {
 				/* Wait for being disabled */
 				;
 			} else if (!backend->shaders_desired) {
 				if (kbdev->pm.backend.protected_transition_override ||
 						!stt->configured_ticks ||
 						WARN_ON(stt->cancel_queued)) {
 					backend->shaders_state = KBASE_SHADERS_WAIT_FINISHED_CORESTACK_ON;
 				} else {
 					stt->remaining_ticks = stt->configured_ticks;
 					stt->needed = true;

 					/* The shader hysteresis timer is not
 					 * done the obvious way, which would be
 					 * to start an hrtimer when the shader
 					 * power off is requested. Instead,
 					 * use a 'tick' timer, and set the
 					 * remaining number of ticks on a power
 					 * off request.  This avoids the
 					 * latency of starting, then
 					 * immediately cancelling an hrtimer
 					 * when the shaders are re-requested
 					 * before the timeout expires.
 					 */
 					if (!hrtimer_active(&stt->timer))
 						hrtimer_start(&stt->timer,
 								stt->configured_interval,
 								HRTIMER_MODE_REL);

 					backend->shaders_state = KBASE_SHADERS_WAIT_OFF_CORESTACK_ON;
 				}
 			} else {
 				if (backend->shaders_avail & ~shaders_ready) {
 					backend->shaders_avail |= shaders_ready;

 					kbase_pm_invoke(kbdev, KBASE_PM_CORE_SHADER,
 							backend->shaders_avail & ~shaders_ready,
 							ACTION_PWRON);
 				}
 				backend->shaders_state = KBASE_SHADERS_PEND_ON_CORESTACK_ON;
 			}
 			break;

 		case KBASE_SHADERS_WAIT_OFF_CORESTACK_ON:
 			if (WARN_ON(!hrtimer_active(&stt->timer))) {
 				stt->remaining_ticks = 0;
 				backend->shaders_state = KBASE_SHADERS_WAIT_FINISHED_CORESTACK_ON;
 			}

 			if (backend->shaders_desired) {
 				stt->remaining_ticks = 0;
 				backend->shaders_state = KBASE_SHADERS_ON_CORESTACK_ON_RECHECK;
 			} else if (stt->remaining_ticks == 0) {
 				backend->shaders_state = KBASE_SHADERS_WAIT_FINISHED_CORESTACK_ON;
 			}
 			break;

 		case KBASE_SHADERS_WAIT_FINISHED_CORESTACK_ON:
 			shader_poweroff_timer_queue_cancel(kbdev);
 			if (kbase_hw_has_issue(kbdev, BASE_HW_ISSUE_TTRX_921)) {
 				kbase_gpu_start_cache_clean_nolock(kbdev);
 				backend->shaders_state =
 					KBASE_SHADERS_L2_FLUSHING_CORESTACK_ON;
 			} else {
 				backend->shaders_state =
 					KBASE_SHADERS_READY_OFF_CORESTACK_ON;
 			}
 			break;

 		case KBASE_SHADERS_L2_FLUSHING_CORESTACK_ON:
 			if (!kbdev->cache_clean_in_progress)
 				backend->shaders_state =
 					KBASE_SHADERS_READY_OFF_CORESTACK_ON;

 			break;

 		case KBASE_SHADERS_READY_OFF_CORESTACK_ON:
 			if (!platform_power_down_only)
 				kbase_pm_invoke(kbdev, KBASE_PM_CORE_SHADER,
 						shaders_ready, ACTION_PWROFF);

 			KBASE_TRACE_ADD(kbdev,
 					PM_CORES_CHANGE_AVAILABLE,
 					NULL, NULL, 0u, 0u);

 			backend->shaders_state = KBASE_SHADERS_PEND_OFF_CORESTACK_ON;
 			break;

 		case KBASE_SHADERS_PEND_OFF_CORESTACK_ON:
 			if ((!shaders_trans && !shaders_ready) || platform_power_down_only) {
 				if (corestack_driver_control && !platform_power_down_only)
 					kbase_pm_invoke(kbdev, KBASE_PM_CORE_STACK,
 							stacks_avail, ACTION_PWROFF);

 				backend->shaders_state = KBASE_SHADERS_OFF_CORESTACK_PEND_OFF;
 			}
 			break;

 		case KBASE_SHADERS_OFF_CORESTACK_PEND_OFF:
 			if ((!stacks_trans && !stacks_ready) ||
 				platform_power_down_only) {
 				/* On powered off, re-enable the hwcnt */
 				backend->pm_shaders_core_mask = 0;
 				backend->hwcnt_desired = true;
 				if (backend->hwcnt_disabled) {
 					kbase_hwcnt_context_enable(
 						kbdev->hwcnt_gpu_ctx);
 					backend->hwcnt_disabled = false;
 				}
 				backend->shaders_state = KBASE_SHADERS_OFF_CORESTACK_OFF_TIMER_PEND_OFF;
 			}
 			break;

 		case KBASE_SHADERS_OFF_CORESTACK_OFF_TIMER_PEND_OFF:
 			if (!hrtimer_active(&stt->timer) && !stt->cancel_queued)
 				backend->shaders_state = KBASE_SHADERS_OFF_CORESTACK_OFF;
 			break;

 		case KBASE_SHADERS_RESET_WAIT:
 			/* Reset complete */
 			if (!backend->in_reset)
 				backend->shaders_state = KBASE_SHADERS_OFF_CORESTACK_OFF_TIMER_PEND_OFF;
 			break;
 		}

 		if (backend->shaders_state != prev_state)
 			dev_dbg(kbdev->dev, "Shader state transition: %s to %s\n",
 				kbase_shader_core_state_to_string(prev_state),
 				kbase_shader_core_state_to_string(
 					backend->shaders_state));

 	} while (backend->shaders_state != prev_state);
 }

 static bool kbase_pm_is_in_desired_state_nolock(struct kbase_device *kbdev)
 {
 	bool in_desired_state = true;

 	lockdep_assert_held(&kbdev->hwaccess_lock);

 	if (kbase_pm_is_l2_desired(kbdev) &&
 			kbdev->pm.backend.l2_state != KBASE_L2_ON)
 		in_desired_state = false;
 	else if (!kbase_pm_is_l2_desired(kbdev) &&
 			kbdev->pm.backend.l2_state != KBASE_L2_OFF)
 		in_desired_state = false;

 	if (kbdev->pm.backend.shaders_desired &&
 			kbdev->pm.backend.shaders_state != KBASE_SHADERS_ON_CORESTACK_ON)
 		in_desired_state = false;
 	else if (!kbdev->pm.backend.shaders_desired &&
 			kbdev->pm.backend.shaders_state != KBASE_SHADERS_OFF_CORESTACK_OFF)
 		in_desired_state = false;

 	return in_desired_state;
 }

 static bool kbase_pm_is_in_desired_state(struct kbase_device *kbdev)
 {
 	bool in_desired_state;
 	unsigned long flags;

 	spin_lock_irqsave(&kbdev->hwaccess_lock, flags);
 	in_desired_state = kbase_pm_is_in_desired_state_nolock(kbdev);
 	spin_unlock_irqrestore(&kbdev->hwaccess_lock, flags);

 	return in_desired_state;
 }

 static bool kbase_pm_is_in_desired_state_with_l2_powered(
 		struct kbase_device *kbdev)
 {
 	bool in_desired_state = false;
 	unsigned long flags;

 	spin_lock_irqsave(&kbdev->hwaccess_lock, flags);
 	if (kbase_pm_is_in_desired_state_nolock(kbdev) &&
 			(kbdev->pm.backend.l2_state == KBASE_L2_ON))
 		in_desired_state = true;
 	spin_unlock_irqrestore(&kbdev->hwaccess_lock, flags);

 	return in_desired_state;
 }

 static void kbase_pm_trace_power_state(struct kbase_device *kbdev)
 {
 	lockdep_assert_held(&kbdev->hwaccess_lock);

 	KBASE_TLSTREAM_AUX_PM_STATE(
 			kbdev,
 			KBASE_PM_CORE_L2,
 			kbase_pm_get_ready_cores(
 				kbdev, KBASE_PM_CORE_L2));
 	KBASE_TLSTREAM_AUX_PM_STATE(
 			kbdev,
 			KBASE_PM_CORE_SHADER,
 			kbase_pm_get_ready_cores(
 				kbdev, KBASE_PM_CORE_SHADER));
 	KBASE_TLSTREAM_AUX_PM_STATE(
 			kbdev,
 			KBASE_PM_CORE_TILER,
 			kbase_pm_get_ready_cores(
 				kbdev,
 				KBASE_PM_CORE_TILER));

 	if (corestack_driver_control)
 		KBASE_TLSTREAM_AUX_PM_STATE(
 				kbdev,
 				KBASE_PM_CORE_STACK,
 				kbase_pm_get_ready_cores(
 					kbdev,
 					KBASE_PM_CORE_STACK));
 }

 void kbase_pm_update_state(struct kbase_device *kbdev)
 {
 	enum kbase_shader_core_state prev_shaders_state =
 			kbdev->pm.backend.shaders_state;

 	lockdep_assert_held(&kbdev->hwaccess_lock);

 	if (!kbdev->pm.backend.gpu_powered)
 		return; /* Do nothing if the GPU is off */

 	kbase_pm_l2_update_state(kbdev);
 	kbase_pm_shaders_update_state(kbdev);

 	/* If the shaders just turned off, re-invoke the L2 state machine, in
 	 * case it was waiting for the shaders to turn off before powering down
 	 * the L2.
 	 */
 	if (prev_shaders_state != KBASE_SHADERS_OFF_CORESTACK_OFF &&
 			kbdev->pm.backend.shaders_state == KBASE_SHADERS_OFF_CORESTACK_OFF)
 		kbase_pm_l2_update_state(kbdev);

 	if (kbase_pm_is_in_desired_state_nolock(kbdev)) {
 		KBASE_TRACE_ADD(kbdev, PM_DESIRED_REACHED, NULL, NULL,
 				true, kbdev->pm.backend.shaders_avail);

 		kbase_pm_trace_power_state(kbdev);

 		KBASE_TRACE_ADD(kbdev, PM_WAKE_WAITERS, NULL, NULL, 0u, 0);
 		wake_up(&kbdev->pm.backend.gpu_in_desired_state_wait);
 	}
 }

 static enum hrtimer_restart
 shader_tick_timer_callback(struct hrtimer *timer)
 {
 	struct kbasep_pm_tick_timer_state *stt = container_of(timer,
 			struct kbasep_pm_tick_timer_state, timer);
 	struct kbase_device *kbdev = container_of(stt, struct kbase_device,
 			pm.backend.shader_tick_timer);
 	struct kbase_pm_backend_data *backend = &kbdev->pm.backend;
 	unsigned long flags;
 	enum hrtimer_restart restart = HRTIMER_NORESTART;

 	spin_lock_irqsave(&kbdev->hwaccess_lock, flags);

 	if (stt->remaining_ticks &&
 			backend->shaders_state == KBASE_SHADERS_WAIT_OFF_CORESTACK_ON) {
 		stt->remaining_ticks--;

 		/* If the remaining ticks just changed from 1 to 0, invoke the
 		 * PM state machine to power off the shader cores.
 		 */
 		if (!stt->remaining_ticks && !backend->shaders_desired)
 			kbase_pm_update_state(kbdev);
 	}

 	if (stt->needed) {
 		hrtimer_forward_now(timer, stt->configured_interval);
 		restart = HRTIMER_RESTART;
 	}

 	spin_unlock_irqrestore(&kbdev->hwaccess_lock, flags);

 	return restart;
 }

 int kbase_pm_state_machine_init(struct kbase_device *kbdev)
 {
 	struct kbasep_pm_tick_timer_state *stt = &kbdev->pm.backend.shader_tick_timer;

 	stt->wq = alloc_workqueue("kbase_pm_shader_poweroff", WQ_HIGHPRI | WQ_UNBOUND, 1);
 	if (!stt->wq)
 		return -ENOMEM;

 	INIT_WORK(&stt->work, shader_poweroff_timer_stop_callback);

 	stt->needed = false;
 	hrtimer_init(&stt->timer, CLOCK_MONOTONIC, HRTIMER_MODE_REL);
 	stt->timer.function = shader_tick_timer_callback;
 	stt->configured_interval = HR_TIMER_DELAY_NSEC(DEFAULT_PM_GPU_POWEROFF_TICK_NS);
 	stt->configured_ticks = DEFAULT_PM_POWEROFF_TICK_SHADER;

 	return 0;
 }

 void kbase_pm_state_machine_term(struct kbase_device *kbdev)
 {
 	hrtimer_cancel(&kbdev->pm.backend.shader_tick_timer.timer);
 	destroy_workqueue(kbdev->pm.backend.shader_tick_timer.wq);
 }

 void kbase_pm_reset_start_locked(struct kbase_device *kbdev)
 {
 	struct kbase_pm_backend_data *backend = &kbdev->pm.backend;

 	lockdep_assert_held(&kbdev->hwaccess_lock);

 	backend->in_reset = true;
 	backend->l2_state = KBASE_L2_RESET_WAIT;
 	backend->shaders_state = KBASE_SHADERS_RESET_WAIT;

 	/* We're in a reset, so hwcnt will have been synchronously disabled by
 	 * this function's caller as part of the reset process. We therefore
 	 * know that any call to kbase_hwcnt_context_disable_atomic, if
 	 * required to sync the hwcnt refcount with our internal state, is
 	 * guaranteed to succeed.
 	 */
 	backend->hwcnt_desired = false;
 	if (!backend->hwcnt_disabled) {
 		WARN_ON(!kbase_hwcnt_context_disable_atomic(
 			kbdev->hwcnt_gpu_ctx));
 		backend->hwcnt_disabled = true;
 	}

 	shader_poweroff_timer_queue_cancel(kbdev);
 }

 void kbase_pm_reset_complete(struct kbase_device *kbdev)
 {
 	struct kbase_pm_backend_data *backend = &kbdev->pm.backend;
 	unsigned long flags;

 	WARN_ON(!kbase_reset_gpu_is_active(kbdev));
 	spin_lock_irqsave(&kbdev->hwaccess_lock, flags);

 	/* As GPU has just been reset, that results in implicit flush of L2
 	 * cache, can safely mark the pending cache flush operation (if there
 	 * was any) as complete and unblock the waiter.
 	 * No work can be submitted whilst GPU reset is ongoing.
 	 */
 	kbase_gpu_cache_clean_wait_complete(kbdev);
 	backend->in_reset = false;
 	kbase_pm_update_state(kbdev);

 	spin_unlock_irqrestore(&kbdev->hwaccess_lock, flags);
 }

 /* Timeout for kbase_pm_wait_for_desired_state when wait_event_killable has
  * aborted due to a fatal signal. If the time spent waiting has exceeded this
  * threshold then there is most likely a hardware issue. */
 #define PM_TIMEOUT (5*HZ) /* 5s */

 static void kbase_pm_timed_out(struct kbase_device *kbdev)
 {
 	dev_err(kbdev->dev, "Power transition timed out unexpectedly\n");
 	dev_err(kbdev->dev, "Desired state :\n");
 	dev_err(kbdev->dev, "\tShader=%016llx\n",
 			kbdev->pm.backend.shaders_desired ? kbdev->pm.backend.shaders_avail : 0);
 	dev_err(kbdev->dev, "Current state :\n");
 	dev_err(kbdev->dev, "\tShader=%08x%08x\n",
 			kbase_reg_read(kbdev,
 				GPU_CONTROL_REG(SHADER_READY_HI)),
 			kbase_reg_read(kbdev,
 				GPU_CONTROL_REG(SHADER_READY_LO)));
 	dev_err(kbdev->dev, "\tTiler =%08x%08x\n",
 			kbase_reg_read(kbdev,
 				GPU_CONTROL_REG(TILER_READY_HI)),
 			kbase_reg_read(kbdev,
 				GPU_CONTROL_REG(TILER_READY_LO)));
 	dev_err(kbdev->dev, "\tL2    =%08x%08x\n",
 			kbase_reg_read(kbdev,
 				GPU_CONTROL_REG(L2_READY_HI)),
 			kbase_reg_read(kbdev,
 				GPU_CONTROL_REG(L2_READY_LO)));
 	dev_err(kbdev->dev, "Cores transitioning :\n");
 	dev_err(kbdev->dev, "\tShader=%08x%08x\n",
 			kbase_reg_read(kbdev, GPU_CONTROL_REG(
 					SHADER_PWRTRANS_HI)),
 			kbase_reg_read(kbdev, GPU_CONTROL_REG(
 					SHADER_PWRTRANS_LO)));
 	dev_err(kbdev->dev, "\tTiler =%08x%08x\n",
 			kbase_reg_read(kbdev, GPU_CONTROL_REG(
 					TILER_PWRTRANS_HI)),
 			kbase_reg_read(kbdev, GPU_CONTROL_REG(
 					TILER_PWRTRANS_LO)));
 	dev_err(kbdev->dev, "\tL2    =%08x%08x\n",
 			kbase_reg_read(kbdev, GPU_CONTROL_REG(
 					L2_PWRTRANS_HI)),
 			kbase_reg_read(kbdev, GPU_CONTROL_REG(
 					L2_PWRTRANS_LO)));

 	dev_err(kbdev->dev, "Sending reset to GPU - all running jobs will be lost\n");
 	if (kbase_prepare_to_reset_gpu(kbdev))
 		kbase_reset_gpu(kbdev);
 }

 void kbase_pm_wait_for_l2_powered(struct kbase_device *kbdev)
 {
 	unsigned long flags;
 	unsigned long timeout;
 	int err;

 	spin_lock_irqsave(&kbdev->hwaccess_lock, flags);
 	kbase_pm_update_state(kbdev);
 	spin_unlock_irqrestore(&kbdev->hwaccess_lock, flags);

 	timeout = jiffies + PM_TIMEOUT;

 	/* Wait for cores */
 	err = wait_event_killable(kbdev->pm.backend.gpu_in_desired_state_wait,
 			kbase_pm_is_in_desired_state_with_l2_powered(kbdev));

 	if (err < 0 && time_after(jiffies, timeout))
 		kbase_pm_timed_out(kbdev);
 }

 void kbase_pm_wait_for_desired_state(struct kbase_device *kbdev)
 {
 	unsigned long flags;
 	unsigned long timeout;
 	int err;

 	/* Let the state machine latch the most recent desired state. */
 	spin_lock_irqsave(&kbdev->hwaccess_lock, flags);
 	kbase_pm_update_state(kbdev);
 	spin_unlock_irqrestore(&kbdev->hwaccess_lock, flags);

 	timeout = jiffies + PM_TIMEOUT;

 	/* Wait for cores */
 	err = wait_event_killable(kbdev->pm.backend.gpu_in_desired_state_wait,
 			kbase_pm_is_in_desired_state(kbdev));

 	if (err < 0 && time_after(jiffies, timeout))
 		kbase_pm_timed_out(kbdev);
 }
 KBASE_EXPORT_TEST_API(kbase_pm_wait_for_desired_state);

 void kbase_pm_enable_interrupts(struct kbase_device *kbdev)
 {
 	unsigned long flags;

 	KBASE_DEBUG_ASSERT(NULL != kbdev);
 	/*
 	 * Clear all interrupts,
 	 * and unmask them all.
 	 */
 	spin_lock_irqsave(&kbdev->hwaccess_lock, flags);
 	kbase_reg_write(kbdev, GPU_CONTROL_REG(GPU_IRQ_CLEAR), GPU_IRQ_REG_ALL);
 	kbase_reg_write(kbdev, GPU_CONTROL_REG(GPU_IRQ_MASK), GPU_IRQ_REG_ALL);
 	spin_unlock_irqrestore(&kbdev->hwaccess_lock, flags);

 	kbase_reg_write(kbdev, JOB_CONTROL_REG(JOB_IRQ_CLEAR), 0xFFFFFFFF);
 	kbase_reg_write(kbdev, JOB_CONTROL_REG(JOB_IRQ_MASK), 0xFFFFFFFF);

 	kbase_reg_write(kbdev, MMU_REG(MMU_IRQ_CLEAR), 0xFFFFFFFF);
 	kbase_reg_write(kbdev, MMU_REG(MMU_IRQ_MASK), 0xFFFFFFFF);
 }

 KBASE_EXPORT_TEST_API(kbase_pm_enable_interrupts);

 void kbase_pm_disable_interrupts_nolock(struct kbase_device *kbdev)
 {
 	KBASE_DEBUG_ASSERT(NULL != kbdev);
 	/*
 	 * Mask all interrupts,
 	 * and clear them all.
 	 */
 	lockdep_assert_held(&kbdev->hwaccess_lock);

 	kbase_reg_write(kbdev, GPU_CONTROL_REG(GPU_IRQ_MASK), 0);
 	kbase_reg_write(kbdev, GPU_CONTROL_REG(GPU_IRQ_CLEAR), GPU_IRQ_REG_ALL);
 	kbase_reg_write(kbdev, JOB_CONTROL_REG(JOB_IRQ_MASK), 0);
 	kbase_reg_write(kbdev, JOB_CONTROL_REG(JOB_IRQ_CLEAR), 0xFFFFFFFF);

 	kbase_reg_write(kbdev, MMU_REG(MMU_IRQ_MASK), 0);
 	kbase_reg_write(kbdev, MMU_REG(MMU_IRQ_CLEAR), 0xFFFFFFFF);
 }

 void kbase_pm_disable_interrupts(struct kbase_device *kbdev)
 {
 	unsigned long flags;

 	spin_lock_irqsave(&kbdev->hwaccess_lock, flags);
 	kbase_pm_disable_interrupts_nolock(kbdev);
 	spin_unlock_irqrestore(&kbdev->hwaccess_lock, flags);
 }

 KBASE_EXPORT_TEST_API(kbase_pm_disable_interrupts);

 /*
  * pmu layout:
  * 0x0000: PMU TAG (RO) (0xCAFECAFE)
  * 0x0004: PMU VERSION ID (RO) (0x00000000)
  * 0x0008: CLOCK ENABLE (RW) (31:1 SBZ, 0 CLOCK STATE)
  */
 void kbase_pm_clock_on(struct kbase_device *kbdev, bool is_resume)
 {
 	bool reset_required = is_resume;
 	unsigned long flags;

 	KBASE_DEBUG_ASSERT(NULL != kbdev);
 	lockdep_assert_held(&kbdev->js_data.runpool_mutex);
 	lockdep_assert_held(&kbdev->pm.lock);

 	if (kbdev->pm.backend.gpu_powered) {
 		/* Already turned on */
 		if (kbdev->poweroff_pending)
 			kbase_pm_enable_interrupts(kbdev);
 		kbdev->poweroff_pending = false;
 		KBASE_DEBUG_ASSERT(!is_resume);
 		return;
 	}

 	kbdev->poweroff_pending = false;

 	KBASE_TRACE_ADD(kbdev, PM_GPU_ON, NULL, NULL, 0u, 0u);

 	if (is_resume && kbdev->pm.backend.callback_power_resume) {
 		kbdev->pm.backend.callback_power_resume(kbdev);
 		return;
 	} else if (kbdev->pm.backend.callback_power_on) {
 		reset_required = kbdev->pm.backend.callback_power_on(kbdev);
 	}

 	spin_lock_irqsave(&kbdev->hwaccess_lock, flags);
 	kbdev->pm.backend.gpu_powered = true;
 	spin_unlock_irqrestore(&kbdev->hwaccess_lock, flags);

 	if (reset_required) {
 		/* GPU state was lost, reset GPU to ensure it is in a
 		 * consistent state */
 		kbase_pm_init_hw(kbdev, PM_ENABLE_IRQS);
 	}

 	mutex_lock(&kbdev->mmu_hw_mutex);
 	spin_lock_irqsave(&kbdev->hwaccess_lock, flags);
 	kbase_ctx_sched_restore_all_as(kbdev);
 	spin_unlock_irqrestore(&kbdev->hwaccess_lock, flags);
 	mutex_unlock(&kbdev->mmu_hw_mutex);

 	/* Enable the interrupts */
 	kbase_pm_enable_interrupts(kbdev);

 	/* Turn on the L2 caches */
 	spin_lock_irqsave(&kbdev->hwaccess_lock, flags);
 	kbdev->pm.backend.l2_desired = true;
 	kbase_pm_update_state(kbdev);
 	spin_unlock_irqrestore(&kbdev->hwaccess_lock, flags);
 }

 KBASE_EXPORT_TEST_API(kbase_pm_clock_on);

 bool kbase_pm_clock_off(struct kbase_device *kbdev, bool is_suspend)
 {
 	unsigned long flags;

 	KBASE_DEBUG_ASSERT(NULL != kbdev);
 	lockdep_assert_held(&kbdev->pm.lock);

 	/* ASSERT that the cores should now be unavailable. No lock needed. */
 	WARN_ON(kbdev->pm.backend.shaders_state != KBASE_SHADERS_OFF_CORESTACK_OFF);

 	kbdev->poweroff_pending = true;

 	if (!kbdev->pm.backend.gpu_powered) {
 		/* Already turned off */
 		if (is_suspend && kbdev->pm.backend.callback_power_suspend)
 			kbdev->pm.backend.callback_power_suspend(kbdev);
 		return true;
 	}

 	KBASE_TRACE_ADD(kbdev, PM_GPU_OFF, NULL, NULL, 0u, 0u);

 	/* Disable interrupts. This also clears any outstanding interrupts */
 	kbase_pm_disable_interrupts(kbdev);
 	/* Ensure that any IRQ handlers have finished */
 	kbase_synchronize_irqs(kbdev);

 	spin_lock_irqsave(&kbdev->hwaccess_lock, flags);

 	if (atomic_read(&kbdev->faults_pending)) {
 		/* Page/bus faults are still being processed. The GPU can not
 		 * be powered off until they have completed */
 		spin_unlock_irqrestore(&kbdev->hwaccess_lock, flags);
 		return false;
 	}

 	kbase_pm_cache_snoop_disable(kbdev);

 	/* The GPU power may be turned off from this point */
 	kbdev->pm.backend.gpu_powered = false;
 	spin_unlock_irqrestore(&kbdev->hwaccess_lock, flags);

 	if (is_suspend && kbdev->pm.backend.callback_power_suspend)
 		kbdev->pm.backend.callback_power_suspend(kbdev);
 	else if (kbdev->pm.backend.callback_power_off)
 		kbdev->pm.backend.callback_power_off(kbdev);
 	return true;
 }

 KBASE_EXPORT_TEST_API(kbase_pm_clock_off);

 struct kbasep_reset_timeout_data {
 	struct hrtimer timer;
 	bool timed_out;
 	struct kbase_device *kbdev;
 };

 void kbase_pm_reset_done(struct kbase_device *kbdev)
 {
 	KBASE_DEBUG_ASSERT(kbdev != NULL);
 	kbdev->pm.backend.reset_done = true;
 	wake_up(&kbdev->pm.backend.reset_done_wait);
 }

 /**
  * kbase_pm_wait_for_reset - Wait for a reset to happen
  *
  * Wait for the %RESET_COMPLETED IRQ to occur, then reset the waiting state.
  *
  * @kbdev: Kbase device
  */
 static void kbase_pm_wait_for_reset(struct kbase_device *kbdev)
 {
 	lockdep_assert_held(&kbdev->pm.lock);

 	wait_event(kbdev->pm.backend.reset_done_wait,
 						(kbdev->pm.backend.reset_done));
 	kbdev->pm.backend.reset_done = false;
 }

 KBASE_EXPORT_TEST_API(kbase_pm_reset_done);

 static enum hrtimer_restart kbasep_reset_timeout(struct hrtimer *timer)
 {
 	struct kbasep_reset_timeout_data *rtdata =
 		container_of(timer, struct kbasep_reset_timeout_data, timer);

 	rtdata->timed_out = 1;

 	/* Set the wait queue to wake up kbase_pm_init_hw even though the reset
 	 * hasn't completed */
 	kbase_pm_reset_done(rtdata->kbdev);

 	return HRTIMER_NORESTART;
 }

 static void kbase_set_jm_quirks(struct kbase_device *kbdev, const u32 prod_id)
 {
 	kbdev->hw_quirks_jm = kbase_reg_read(kbdev,
 				GPU_CONTROL_REG(JM_CONFIG));
 	if (GPU_ID2_MODEL_MATCH_VALUE(prod_id) == GPU_ID2_PRODUCT_TMIX) {
 		/* Only for tMIx */
 		u32 coherency_features;

 		coherency_features = kbase_reg_read(kbdev,
 					GPU_CONTROL_REG(COHERENCY_FEATURES));

 		/* (COHERENCY_ACE_LITE | COHERENCY_ACE) was incorrectly
 		 * documented for tMIx so force correct value here.
 		 */
 		if (coherency_features ==
 				COHERENCY_FEATURE_BIT(COHERENCY_ACE)) {
 			kbdev->hw_quirks_jm |= (COHERENCY_ACE_LITE |
 					COHERENCY_ACE) <<
 					JM_FORCE_COHERENCY_FEATURES_SHIFT;
 		}
 	}
 	if (kbase_hw_has_feature(kbdev, BASE_HW_FEATURE_IDVS_GROUP_SIZE)) {
 		int default_idvs_group_size = 0xF;
 		u32 tmp;

 		if (of_property_read_u32(kbdev->dev->of_node,
 					"idvs-group-size", &tmp))
 			tmp = default_idvs_group_size;

 		if (tmp > JM_MAX_IDVS_GROUP_SIZE) {
 			dev_err(kbdev->dev,
 				"idvs-group-size of %d is too large. Maximum value is %d",
 				tmp, JM_MAX_IDVS_GROUP_SIZE);
 			tmp = default_idvs_group_size;
 		}

 		kbdev->hw_quirks_jm |= tmp << JM_IDVS_GROUP_SIZE_SHIFT;
 	}

 #define MANUAL_POWER_CONTROL ((u32)(1 << 8))
 	if (corestack_driver_control)
 		kbdev->hw_quirks_jm |= MANUAL_POWER_CONTROL;
 }

 static void kbase_set_sc_quirks(struct kbase_device *kbdev, const u32 prod_id)
 {
 	kbdev->hw_quirks_sc = kbase_reg_read(kbdev,
 					GPU_CONTROL_REG(SHADER_CONFIG));

 	/* Needed due to MIDBASE-1494: LS_PAUSEBUFFER_DISABLE.
 	 * See PRLAM-8443 and needed due to MIDGLES-3539.
 	 * See PRLAM-11035.
 	 */
 	if (kbase_hw_has_issue(kbdev, BASE_HW_ISSUE_8443) ||
 			kbase_hw_has_issue(kbdev, BASE_HW_ISSUE_11035))
 		kbdev->hw_quirks_sc |= SC_LS_PAUSEBUFFER_DISABLE;

 	/* Needed due to MIDBASE-2054: SDC_DISABLE_OQ_DISCARD.
 	 * See PRLAM-10327.
 	 */
 	if (kbase_hw_has_issue(kbdev, BASE_HW_ISSUE_10327))
 		kbdev->hw_quirks_sc |= SC_SDC_DISABLE_OQ_DISCARD;

 	/* Needed due to MIDBASE-2795. ENABLE_TEXGRD_FLAGS.
 	 * See PRLAM-10797.
 	 */
 	if (kbase_hw_has_issue(kbdev, BASE_HW_ISSUE_10797))
 		kbdev->hw_quirks_sc |= SC_ENABLE_TEXGRD_FLAGS;

 	if (!kbase_hw_has_issue(kbdev, GPUCORE_1619)) {
 		if (prod_id < 0x750 || prod_id == 0x6956) /* T60x, T62x, T72x */
 			kbdev->hw_quirks_sc |= SC_LS_ATTR_CHECK_DISABLE;
 		else if (prod_id >= 0x750 && prod_id <= 0x880) /* T76x, T8xx */
 			kbdev->hw_quirks_sc |= SC_LS_ALLOW_ATTR_TYPES;
 	}

 	if (kbase_hw_has_issue(kbdev, BASE_HW_ISSUE_TTRX_2968_TTRX_3162))
 		kbdev->hw_quirks_sc |= SC_VAR_ALGORITHM;

 	if (kbase_hw_has_feature(kbdev, BASE_HW_FEATURE_TLS_HASHING))
 		kbdev->hw_quirks_sc |= SC_TLS_HASH_ENABLE;
 }

 static void kbase_set_tiler_quirks(struct kbase_device *kbdev)
 {
 	kbdev->hw_quirks_tiler = kbase_reg_read(kbdev,
 					GPU_CONTROL_REG(TILER_CONFIG));
 	/* Set tiler clock gate override if required */
 	if (kbase_hw_has_issue(kbdev, BASE_HW_ISSUE_T76X_3953))
 		kbdev->hw_quirks_tiler |= TC_CLOCK_GATE_OVERRIDE;
 }

 static void kbase_pm_hw_issues_detect(struct kbase_device *kbdev)
 {
 	struct device_node *np = kbdev->dev->of_node;
 	const u32 gpu_id = kbdev->gpu_props.props.raw_props.gpu_id;
 	const u32 prod_id = (gpu_id & GPU_ID_VERSION_PRODUCT_ID) >>
 				GPU_ID_VERSION_PRODUCT_ID_SHIFT;

 	kbdev->hw_quirks_jm = 0;
 	kbdev->hw_quirks_sc = 0;
 	kbdev->hw_quirks_tiler = 0;
 	kbdev->hw_quirks_mmu = 0;

 	if (!of_property_read_u32(np, "quirks_jm",
 				&kbdev->hw_quirks_jm)) {
 		dev_info(kbdev->dev,
 			"Found quirks_jm = [0x%x] in Devicetree\n",
 			kbdev->hw_quirks_jm);
 	} else {
 		kbase_set_jm_quirks(kbdev, prod_id);
 	}

 	if (!of_property_read_u32(np, "quirks_sc",
 				&kbdev->hw_quirks_sc)) {
 		dev_info(kbdev->dev,
 			"Found quirks_sc = [0x%x] in Devicetree\n",
 			kbdev->hw_quirks_sc);
 	} else {
 		kbase_set_sc_quirks(kbdev, prod_id);
 	}

 	if (!of_property_read_u32(np, "quirks_tiler",
 				&kbdev->hw_quirks_tiler)) {
 		dev_info(kbdev->dev,
 			"Found quirks_tiler = [0x%x] in Devicetree\n",
 			kbdev->hw_quirks_tiler);
 	} else {
 		kbase_set_tiler_quirks(kbdev);
 	}

 	if (!of_property_read_u32(np, "quirks_mmu",
 				&kbdev->hw_quirks_mmu)) {
 		dev_info(kbdev->dev,
 			"Found quirks_mmu = [0x%x] in Devicetree\n",
 			kbdev->hw_quirks_mmu);
 	} else {
 		kbase_set_mmu_quirks(kbdev);
 	}
 }

 static void kbase_pm_hw_issues_apply(struct kbase_device *kbdev)
 {
 	kbase_reg_write(kbdev, GPU_CONTROL_REG(SHADER_CONFIG),
 			kbdev->hw_quirks_sc);

 	kbase_reg_write(kbdev, GPU_CONTROL_REG(TILER_CONFIG),
 			kbdev->hw_quirks_tiler);

 	kbase_reg_write(kbdev, GPU_CONTROL_REG(L2_MMU_CONFIG),
 			kbdev->hw_quirks_mmu);
 	kbase_reg_write(kbdev, GPU_CONTROL_REG(JM_CONFIG),
 			kbdev->hw_quirks_jm);
 }

 void kbase_pm_cache_snoop_enable(struct kbase_device *kbdev)
 {
 	if ((kbdev->current_gpu_coherency_mode == COHERENCY_ACE) &&
 		!kbdev->cci_snoop_enabled) {
 #ifdef CONFIG_ARM64
 		if (kbdev->snoop_enable_smc != 0)
 			kbase_invoke_smc_fid(kbdev->snoop_enable_smc, 0, 0, 0);
 #endif /* CONFIG_ARM64 */
 		dev_dbg(kbdev->dev, "MALI - CCI Snoops - Enabled\n");
 		kbdev->cci_snoop_enabled = true;
 	}
 }

 void kbase_pm_cache_snoop_disable(struct kbase_device *kbdev)
 {
 	if (kbdev->cci_snoop_enabled) {
 #ifdef CONFIG_ARM64
 		if (kbdev->snoop_disable_smc != 0) {
 			mali_cci_flush_l2(kbdev);
 			kbase_invoke_smc_fid(kbdev->snoop_disable_smc, 0, 0, 0);
 		}
 #endif /* CONFIG_ARM64 */
 		dev_dbg(kbdev->dev, "MALI - CCI Snoops Disabled\n");
 		kbdev->cci_snoop_enabled = false;
 	}
 }

 static void reenable_protected_mode_hwcnt(struct kbase_device *kbdev)
 {
 	unsigned long irq_flags;

 	spin_lock_irqsave(&kbdev->hwaccess_lock, irq_flags);
 	kbdev->protected_mode_hwcnt_desired = true;
 	if (kbdev->protected_mode_hwcnt_disabled) {
 		kbase_hwcnt_context_enable(kbdev->hwcnt_gpu_ctx);
 		kbdev->protected_mode_hwcnt_disabled = false;
 	}
 	spin_unlock_irqrestore(&kbdev->hwaccess_lock, irq_flags);
 }

 static int kbase_pm_do_reset(struct kbase_device *kbdev)
 {
 	struct kbasep_reset_timeout_data rtdata;

 	KBASE_TRACE_ADD(kbdev, CORE_GPU_SOFT_RESET, NULL, NULL, 0u, 0);

 	KBASE_TLSTREAM_JD_GPU_SOFT_RESET(kbdev, kbdev);

 	kbase_reg_write(kbdev, GPU_CONTROL_REG(GPU_COMMAND),
 						GPU_COMMAND_SOFT_RESET);

 	/* Unmask the reset complete interrupt only */
 	kbase_reg_write(kbdev, GPU_CONTROL_REG(GPU_IRQ_MASK), RESET_COMPLETED);

 	/* Initialize a structure for tracking the status of the reset */
 	rtdata.kbdev = kbdev;
 	rtdata.timed_out = 0;

 	/* Create a timer to use as a timeout on the reset */
 	hrtimer_init_on_stack(&rtdata.timer, CLOCK_MONOTONIC, HRTIMER_MODE_REL);
 	rtdata.timer.function = kbasep_reset_timeout;

 	hrtimer_start(&rtdata.timer, HR_TIMER_DELAY_MSEC(RESET_TIMEOUT),
 							HRTIMER_MODE_REL);

 	/* Wait for the RESET_COMPLETED interrupt to be raised */
 	kbase_pm_wait_for_reset(kbdev);

 	if (rtdata.timed_out == 0) {
 		/* GPU has been reset */
 		hrtimer_cancel(&rtdata.timer);
 		destroy_hrtimer_on_stack(&rtdata.timer);
 		return 0;
 	}

 	/* No interrupt has been received - check if the RAWSTAT register says
 	 * the reset has completed */
 	if (kbase_reg_read(kbdev, GPU_CONTROL_REG(GPU_IRQ_RAWSTAT)) &
 							RESET_COMPLETED) {
 		/* The interrupt is set in the RAWSTAT; this suggests that the
 		 * interrupts are not getting to the CPU */
 		dev_err(kbdev->dev, "Reset interrupt didn't reach CPU. Check interrupt assignments.\n");
 		/* If interrupts aren't working we can't continue. */
 		destroy_hrtimer_on_stack(&rtdata.timer);
 		return -EINVAL;
 	}

 	/* The GPU doesn't seem to be responding to the reset so try a hard
 	 * reset */
 	dev_err(kbdev->dev, "Failed to soft-reset GPU (timed out after %d ms), now attempting a hard reset\n",
 								RESET_TIMEOUT);
 	KBASE_TRACE_ADD(kbdev, CORE_GPU_HARD_RESET, NULL, NULL, 0u, 0);
 	kbase_reg_write(kbdev, GPU_CONTROL_REG(GPU_COMMAND),
 						GPU_COMMAND_HARD_RESET);

 	/* Restart the timer to wait for the hard reset to complete */
 	rtdata.timed_out = 0;

 	hrtimer_start(&rtdata.timer, HR_TIMER_DELAY_MSEC(RESET_TIMEOUT),
 							HRTIMER_MODE_REL);

 	/* Wait for the RESET_COMPLETED interrupt to be raised */
 	kbase_pm_wait_for_reset(kbdev);

 	if (rtdata.timed_out == 0) {
 		/* GPU has been reset */
 		hrtimer_cancel(&rtdata.timer);
 		destroy_hrtimer_on_stack(&rtdata.timer);
 		return 0;
 	}

 	destroy_hrtimer_on_stack(&rtdata.timer);

 	dev_err(kbdev->dev, "Failed to hard-reset the GPU (timed out after %d ms)\n",
 								RESET_TIMEOUT);

 	return -EINVAL;
 }

 static int kbasep_protected_mode_enable(struct protected_mode_device *pdev)
 {
 	struct kbase_device *kbdev = pdev->data;

 	kbase_reg_write(kbdev, GPU_CONTROL_REG(GPU_COMMAND),
 		GPU_COMMAND_SET_PROTECTED_MODE);
 	return 0;
 }

 static int kbasep_protected_mode_disable(struct protected_mode_device *pdev)
 {
 	struct kbase_device *kbdev = pdev->data;

 	lockdep_assert_held(&kbdev->pm.lock);

 	return kbase_pm_do_reset(kbdev);
 }

 struct protected_mode_ops kbase_native_protected_ops = {
 	.protected_mode_enable = kbasep_protected_mode_enable,
 	.protected_mode_disable = kbasep_protected_mode_disable
 };

 int kbase_pm_init_hw(struct kbase_device *kbdev, unsigned int flags)
 {
 	unsigned long irq_flags;
 	int err;

 	KBASE_DEBUG_ASSERT(NULL != kbdev);
 	lockdep_assert_held(&kbdev->pm.lock);

 	/* Ensure the clock is on before attempting to access the hardware */
 	if (!kbdev->pm.backend.gpu_powered) {
 		if (kbdev->pm.backend.callback_power_on)
 			kbdev->pm.backend.callback_power_on(kbdev);

 		kbdev->pm.backend.gpu_powered = true;
 	}

 	/* Ensure interrupts are off to begin with, this also clears any
 	 * outstanding interrupts */
 	kbase_pm_disable_interrupts(kbdev);
 	/* Ensure cache snoops are disabled before reset. */
 	kbase_pm_cache_snoop_disable(kbdev);
 	/* Prepare for the soft-reset */
 	kbdev->pm.backend.reset_done = false;

 	/* The cores should be made unavailable due to the reset */
 	spin_lock_irqsave(&kbdev->hwaccess_lock, irq_flags);
 	if (kbdev->pm.backend.shaders_state != KBASE_SHADERS_OFF_CORESTACK_OFF)
 		KBASE_TRACE_ADD(kbdev, PM_CORES_CHANGE_AVAILABLE, NULL,
 				NULL, 0u, (u32)0u);
 	spin_unlock_irqrestore(&kbdev->hwaccess_lock, irq_flags);

 	/* Soft reset the GPU */
 	if (kbdev->protected_mode_support)
 		err = kbdev->protected_ops->protected_mode_disable(
 				kbdev->protected_dev);
 	else
 		err = kbase_pm_do_reset(kbdev);

 	spin_lock_irqsave(&kbdev->hwaccess_lock, irq_flags);
 	kbdev->protected_mode = false;
 	spin_unlock_irqrestore(&kbdev->hwaccess_lock, irq_flags);

 	if (err)
 		goto exit;

 	if (flags & PM_HW_ISSUES_DETECT)
 		kbase_pm_hw_issues_detect(kbdev);

 	kbase_pm_hw_issues_apply(kbdev);
 	kbase_cache_set_coherency_mode(kbdev, kbdev->system_coherency);

 	/* Sanity check protected mode was left after reset */
 	if (kbase_hw_has_feature(kbdev, BASE_HW_FEATURE_PROTECTED_MODE)) {
 		u32 gpu_status = kbase_reg_read(kbdev,
 				GPU_CONTROL_REG(GPU_STATUS));

 		WARN_ON(gpu_status & GPU_STATUS_PROTECTED_MODE_ACTIVE);
 	}

 	/* If cycle counter was in use re-enable it, enable_irqs will only be
 	 * false when called from kbase_pm_powerup */
 	if (kbdev->pm.backend.gpu_cycle_counter_requests &&
 						(flags & PM_ENABLE_IRQS)) {
 		kbase_pm_enable_interrupts(kbdev);

 		/* Re-enable the counters if we need to */
 		spin_lock_irqsave(
 			&kbdev->pm.backend.gpu_cycle_counter_requests_lock,
 								irq_flags);
 		if (kbdev->pm.backend.gpu_cycle_counter_requests)
 			kbase_reg_write(kbdev, GPU_CONTROL_REG(GPU_COMMAND),
 					GPU_COMMAND_CYCLE_COUNT_START);
 		spin_unlock_irqrestore(
 			&kbdev->pm.backend.gpu_cycle_counter_requests_lock,
 								irq_flags);

 		kbase_pm_disable_interrupts(kbdev);
 	}

 	if (flags & PM_ENABLE_IRQS)
 		kbase_pm_enable_interrupts(kbdev);

 exit:
 	if (!kbdev->pm.backend.protected_entry_transition_override) {
 		/* Re-enable GPU hardware counters if we're resetting from
 		 * protected mode.
 		 */
 		reenable_protected_mode_hwcnt(kbdev);
 	}

 	return err;
 }

 /**
  * kbase_pm_request_gpu_cycle_counter_do_request - Request cycle counters
  *
  * Increase the count of cycle counter users and turn the cycle counters on if
  * they were previously off
  *
  * This function is designed to be called by
  * kbase_pm_request_gpu_cycle_counter() or
  * kbase_pm_request_gpu_cycle_counter_l2_is_on() only
  *
  * When this function is called the l2 cache must be on - i.e., the GPU must be
  * on.
  *
  * @kbdev:     The kbase device structure of the device
  */
 static void
 kbase_pm_request_gpu_cycle_counter_do_request(struct kbase_device *kbdev)
 {
 	unsigned long flags;

 	spin_lock_irqsave(&kbdev->pm.backend.gpu_cycle_counter_requests_lock,
 									flags);

 	++kbdev->pm.backend.gpu_cycle_counter_requests;

 	if (1 == kbdev->pm.backend.gpu_cycle_counter_requests)
 		kbase_reg_write(kbdev, GPU_CONTROL_REG(GPU_COMMAND),
 					GPU_COMMAND_CYCLE_COUNT_START);

 	spin_unlock_irqrestore(
 			&kbdev->pm.backend.gpu_cycle_counter_requests_lock,
 									flags);
 }

 void kbase_pm_request_gpu_cycle_counter(struct kbase_device *kbdev)
 {
 	KBASE_DEBUG_ASSERT(kbdev != NULL);

 	KBASE_DEBUG_ASSERT(kbdev->pm.backend.gpu_powered);

 	KBASE_DEBUG_ASSERT(kbdev->pm.backend.gpu_cycle_counter_requests <
 								INT_MAX);

 	kbase_pm_request_gpu_cycle_counter_do_request(kbdev);
 }

 KBASE_EXPORT_TEST_API(kbase_pm_request_gpu_cycle_counter);

 void kbase_pm_request_gpu_cycle_counter_l2_is_on(struct kbase_device *kbdev)
 {
 	KBASE_DEBUG_ASSERT(kbdev != NULL);

 	KBASE_DEBUG_ASSERT(kbdev->pm.backend.gpu_powered);

 	KBASE_DEBUG_ASSERT(kbdev->pm.backend.gpu_cycle_counter_requests <
 								INT_MAX);

 	kbase_pm_request_gpu_cycle_counter_do_request(kbdev);
 }

 KBASE_EXPORT_TEST_API(kbase_pm_request_gpu_cycle_counter_l2_is_on);

 void kbase_pm_release_gpu_cycle_counter_nolock(struct kbase_device *kbdev)
 {
 	unsigned long flags;

 	KBASE_DEBUG_ASSERT(kbdev != NULL);

 	lockdep_assert_held(&kbdev->hwaccess_lock);

 	spin_lock_irqsave(&kbdev->pm.backend.gpu_cycle_counter_requests_lock,
 									flags);

 	KBASE_DEBUG_ASSERT(kbdev->pm.backend.gpu_cycle_counter_requests > 0);

 	--kbdev->pm.backend.gpu_cycle_counter_requests;

 	if (0 == kbdev->pm.backend.gpu_cycle_counter_requests)
 		kbase_reg_write(kbdev, GPU_CONTROL_REG(GPU_COMMAND),
 					GPU_COMMAND_CYCLE_COUNT_STOP);

 	spin_unlock_irqrestore(
 			&kbdev->pm.backend.gpu_cycle_counter_requests_lock,
 									flags);
 }

 void kbase_pm_release_gpu_cycle_counter(struct kbase_device *kbdev)
 {
 	unsigned long flags;

 	spin_lock_irqsave(&kbdev->hwaccess_lock, flags);

 	kbase_pm_release_gpu_cycle_counter_nolock(kbdev);

 	spin_unlock_irqrestore(&kbdev->hwaccess_lock, flags);
 }

 KBASE_EXPORT_TEST_API(kbase_pm_release_gpu_cycle_counter);